本期讲解的是TBtools序列工具中的Fasta序列信息统计及序列操作,包括Fasta Stats和Sequence Manipulate两部分。
进入TBtools界面,点击Sequence Toolkit进入Fasta Tools即可看到(如下图)。
为了更直观展的示结果,以下操作将用到我虚构的名为test.fasta的文件(如下图),大家在实际操作时换成自己需要的Fasta文件即可。
代码语言:javascript复制>contings-1
AGCAATTCCACCTTCGTAA
>contings-2
AAGTCACCAGGGGATGCAA
>contings-3
TCTGTTTCACACTCATCTT
TAAAGGTAGTTTCAATAAT
>contings-4
AGTGCCATTTCTTTAAATA
TCACTTTTTTATCTTCTCT
TTTAAAATTAACAACATTA
>contings-5
TAATAAGTCACAGTCATGC
ATTGCATTATTAGCTTCAT
AAGTTCCGTGCATTCCAAG
CATTCCTAAAAATTGATTA
TCATTTCCAGGATAAGCAC
CTAGGCCTTGTAAAGTTGA
>contings-6
GCATGTGCATGACCTTGGC
TTCCATAACCAAAAATTGC
TATTTTTTTACTTTTAATT
AAATCTACATCTGCATCTT
ATAAAACATTTTCATTTTT
1.Fasta Stats
该工具可获取Fasta序列的以下信息:
①Total_Len(序列总长)
②Total_Seq_Num(染色体数)
③Total_N _Counts(未测通的碱基数)
④Total_LowCase_Counts(重复序列的标志)
⑤Total_GC_content(GC含量)
⑥Minimum Len(最小序列长度)
⑦Maximum Len(最大序列长度)
⑧Mean Len(平均序列长度)
⑨Median Len(序列中位数长度)
⑩N50
具体操作,如下图所示:
2.Sequence Manipulate
该工具可以对序列进行以下操作(可勾选多个组合使用):
Reverse(反向)
Complement(互补)
RNA(序列对应的RNA序列)
UpperCase(大写)
LowerCase(小写)
其他可选项:
Only IDs(只显示序列ID)
Only Seqs(只显示序列信息)
Seq in one Line(序列显示在一行)
Bases per Line(每一行的碱基数,设置需要取消勾选[Seq in one Line])
具体操作,如下图所示: