FastTree:速度最快的最大似然法进化树构建软件

2020-05-08 16:37:05 浏览数 (1)

欢迎关注”生信修炼手册”!

FastTree 是基于最大似然法构建进化树的软件,它最大的特点就是运行速度快,支持几百万条序列的建树任务。官方的说法是,对于大的比对数据集,FastTree 比phyml或者RAxML 快100到1000倍。官网如下

http://www.microbesonline.org/fasttree/

FastTree 支持核酸和蛋白的进化树构建,对于核酸,可选的替换模型包括以下几种

  1. JC
  2. GTR

默认的模型为JC。

对于蛋白质,可选的替换模型包括以下几种

  1. JTT
  2. LG
  3. WAG

默认的模型为JTT。

利用不同的测试数据集,比较了fastTree 不同替换模型和RAxML, PhyML 运行速度的差异。结果如下

对于蛋白序列而言,FastTree 的运行速度比其他两款软件快了1000多倍,而且对于几万条序列的比对,其他两款软件的运行时间太久,超过了可以忍受的范围;对于核酸序列而言,默认的JC模型的速度最快, GTR模型速度少稍差一筹,其他两款软件同样运行速度慢的不行。

FastTree 除了运行速度快之外,准确度也令人满意,比较的结果如下

对于几万条的核酸序列,只有FastTree, NJ, Clearcut 这3个软件有结果,而FastTree 的准确度是最高的,从此可以看出,对于几万条核酸序列的进化树分析,FastTree 是最佳选择之一;对于蛋白序列,在可以运行出结果的前提下,FastTree 的准确度相比RAxML, PhyML 都稍差一点。

综合运行速度和建树的准确性,FastTree 都是最佳的进化树构建软件之一。 我们可以直接从官网下载可执行文件

FastTree要求输入的多序列比对结果为FASTA或者Phylip格式,对于蛋白质的进化树构建,基本用法如下

代码语言:javascript复制
FastTree protein.fasta > tree

也可以选择LG或者WAG替换模型,用法如下

代码语言:javascript复制
FastTree -lg protein.fasta > tree
FastTree -wag protein.fasta > tree

对于核酸序列,基本用法如下

代码语言:javascript复制
FastTree -nt nucleotide.fasta > tree

也可以选择GTR替换模型,用法如下

代码语言:javascript复制
FastTree -nt  -gtr nucleotide.fasta > tree

默认生成的tree 文件是 Newick格式, 可以导入 figTree 或者 TreeViewer等软件中进行查看。

·end·

—如果喜欢,快分享给你的朋友们吧—

0 人点赞