很多对于真菌的高通量测序研究会扩增ITS区域基因,并进行了基于系统发育树的一系列分析,如系统发育多样性、群落构建等。
事实上,ITS区域的高序列变异性有助于更准确的物种鉴定,但由于难以对序列进行准确比对,使得跨进化距离较远的真菌的多序列比对和系统发育分析不可靠。
之前对这个问题重视程度不够,这样做的文章发了不少。但准确性其实是存疑的。这两年这个问题越来越得到重视,不少人在投稿的时候会收到审稿人否定ITS区域系统发育分析的意见。
本文给出两个解决办法,他们的底层逻辑是一样的。
1.ghost-tree
2016年一篇Microbiome提出了ghost-tree这种方法,将来自两个遗传标记的序列数据集成到一个可以用于的系统发育树中。
该方法从基于一个基因标记的“基础”系统发育开始,该标记的序列可以在跨不同分类群的生物体(例如,真菌科水平)之间进行比对。然后,利用第二种更快速进化的遗传标记,为更密切相关的生物体(如真菌物种或菌株水平)建立“扩展”系统发育。然后,通过映射分类名称,这些较小的系统发育被嫁接到基础树上,这样每个相应的基础树尖端将分支到它新的“扩展树”子树。
可利用ghost-tree将ITS序列的真菌扩展系统发育移植到真菌18S序列衍生的基础系统发育上。对模拟和真实真菌ITS数据集的分析发现,使用ghost-tree系统发育距离计算的真菌群落之间的系统发育距离解释的方差显著大于非系统发育距离。系统发育指标还提高了区分微生物群落间微小差异的能力。
参考:
Fouquier, J., Rideout, J.R., Bolyen, E. et al. ghost-tree: creating hybrid-gene phylogenetic trees for diversity analyses. Microbiome 4, 11 (2016). https://doi.org/10.1186/s40168-016-0153-6
2.taxonomy_to_tree
这篇文章对ITS2区域进行了测序,并进行了基于Stegen方法的群落构建分析。
Gao C, et al Taylor J*. (2019) Fungal community assembly in drought-stressed sorghum shows stochasticity, selection, and universal ecological dynamics. Nature Communications* doi https://doi.org/10.1038/s41467-019-13913-9
文章采用
Tedersoo, L. et al. High-level classification of the Fungi and a tool for evolutionary ecological analyses. Fungal Divers 90, 135–159 (2018).
中的taxonomy_to_tree.pl代码,将ITS2区域得到的物种映射到18S和28S rDNA序列中,重新构建系统发育树。
taxonomy_to_tree.pl代码:
https://static-content.springer.com/esm/art:10.1007/s13225-018-0401-0/MediaObjects/13225_2018_401_MOESM3_ESM.pl