TBtools | 序列信息统计及序列操作

2021-12-08 08:23:15 浏览数 (2)

本期讲解的是TBtools序列工具中的Fasta序列信息统计及序列操作,包括Fasta Stats和Sequence Manipulate两部分。

进入TBtools界面,点击Sequence Toolkit进入Fasta Tools即可看到(如下图)。

为了更直观展的示结果,以下操作将用到我虚构的名为test.fasta的文件(如下图),大家在实际操作时换成自己需要的Fasta文件即可。

代码语言:javascript复制
>contings-1
AGCAATTCCACCTTCGTAA
>contings-2
AAGTCACCAGGGGATGCAA
>contings-3
TCTGTTTCACACTCATCTT
TAAAGGTAGTTTCAATAAT
>contings-4
AGTGCCATTTCTTTAAATA
TCACTTTTTTATCTTCTCT
TTTAAAATTAACAACATTA
>contings-5
TAATAAGTCACAGTCATGC
ATTGCATTATTAGCTTCAT
AAGTTCCGTGCATTCCAAG
CATTCCTAAAAATTGATTA
TCATTTCCAGGATAAGCAC
CTAGGCCTTGTAAAGTTGA
>contings-6
GCATGTGCATGACCTTGGC
TTCCATAACCAAAAATTGC
TATTTTTTTACTTTTAATT
AAATCTACATCTGCATCTT
ATAAAACATTTTCATTTTT

1.Fasta Stats

该工具可获取Fasta序列的以下信息:

①Total_Len(序列总长)

②Total_Seq_Num(染色体数)

③Total_N _Counts(未测通的碱基数)

④Total_LowCase_Counts(重复序列的标志)

⑤Total_GC_content(GC含量)

⑥Minimum Len(最小序列长度)

⑦Maximum Len(最大序列长度)

⑧Mean Len(平均序列长度)

⑨Median Len(序列中位数长度)

⑩N50

具体操作,如下图所示:

2.Sequence Manipulate

该工具可以对序列进行以下操作(可勾选多个组合使用):

Reverse(反向)

Complement(互补)

RNA(序列对应的RNA序列)

UpperCase(大写)

LowerCase(小写)

其他可选项:

Only IDs(只显示序列ID)

Only Seqs(只显示序列信息)

Seq in one Line(序列显示在一行)

Bases per Line(每一行的碱基数,设置需要取消勾选[Seq in one Line])

具体操作,如下图所示:

0 人点赞