本期讲解的是TBtools序列工具中的Fasta序列提取及过滤。进入TBtools界面,点击Sequence Toolkit进入Fasta Tools即可看到(如下图)。
Fasta序列提取及过滤分为四个工具:
Fasta Extract (Recommended)
Fasta Extract or Filter (Quick)
Fasta Extract (Basic)
Fasta Subseq (Basic)
一般推荐使用Fasta Extract (Recommended)即可,包含其他三个几乎所有功能。唯一不同的是Fasta Extract or Filter (Quick)中包含了过滤的功能,在这里不做赘述了。
为了便于演示,我虚构了一个名为test.fasta的序列文件,如下:
代码语言:javascript复制>contings-1
AGCAATTCCACCTTCGTAA
>contings-2
AAGTCACCAGGGGATGCAA
>contings-3
TCTGTTTCACACTCATCTT
TAAAGGTAGTTTCAATAAT
>contings-4
AGTGCCATTTCTTTAAATA
TCACTTTTTTATCTTCTCT
TTTAAAATTAACAACATTA
>contings-5
TAATAAGTCACAGTCATGC
ATTGCATTATTAGCTTCAT
AAGTTCCGTGCATTCCAAG
CATTCCTAAAAATTGATTA
TCATTTCCAGGATAAGCAC
CTAGGCCTTGTAAAGTTGA
>contings-6
GCATGTGCATGACCTTGGC
TTCCATAACCAAAAATTGC
TATTTTTTTACTTTTAATT
AAATCTACATCTGCATCTT
ATAAAACATTTTCATTTTT
Fasta Extract (Recommended)主要功能包括:
(1)提取Fasta序列文件中的某一个或者多个基因
在这里我们选择提取test.fasta中contings-1和contings-6。
输出结果:
代码语言:javascript复制>contings-1
AGCAATTCCACCTTCGTAA
>contings-6
GCATGTGCATGACCTTGGCTTCCATAACCAAAAATTGCTATTTTTTTACTTTTAATTAAA
TCTACATCTGCATCTTATAAAACATTTTCATTTTT
(2)提取Fasta序列文件中的序列区段
在这里我们选择提取test.fasta中contings-1的2-6号碱基、contings-3的4-8号碱基、contings-6的1-3号碱基。
输出结果:
代码语言:javascript复制>contings-1 2 6
GCAAT
>contings-3 4 8
GTTTC
>contings-6 1 3
GCA