RNAmmer:预测基因组上的核糖体RNA

2020-05-08 16:31:12 浏览数 (1)

核糖体RNA, 缩写为rRNA, 是细胞内含量最多的一类RNA, 能够与蛋白质结合形成核糖体,完成氨基酸的合成。rRNA分子量较大,通常利用沉降系数来区分不同类别的rRNA,沉降系数越大,分子量越大。

在原核生物中,包含以下3种类型的rRNA

  1. 5S
  2. 16S
  3. 23S

在真核生物中,包含以下4种类型的rRNA

  1. 5S
  2. 5.8S
  3. 18S
  4. 28S

RNAmmer能够预测基因组序列上的rRNA,官网如下

http://www.cbs.dtu.dk/services/RNAmmer/

该软件支持以上所有类型的rRNA的预测,在官网上,提供了在线服务,只需要输入fasta格式的序列,然后选择物种类别,就可以预测了,最大允许上传1M大小的fasta序列。

输出结果如下

1. rRNA在基因组上的位置

采用GFF的格式,输出rRNA基因的染色体,起始和终止位置,正负链信息,还包括了rRNA的类型。

2. rRNA 序列

GFF格式只是记录了基因组上的位置,除此之外,还提供了rRNA的序列,可供下载。

对于大学等科研结构,可以免费下载该软件。本地版软件的用法如下

代码语言:javascript复制
rnammer -S bac -m lsu,ssu,tsu -xml ecoli.xml -gff ecoli.gff -h ecoli.hmmreport < ecoli.fsa

-S参数指定物种类型,arc代表古菌,bac代表细菌,euk代表真核生物;-xml指定XML格式的输出结果;-gff指定GFF格式的输出结果;-h指定html格式的输出结果。

需要注意的是,本地版的rnammer依赖hmmer2.0版本。可执行文件rnammer 是一个perl脚本,需要编辑这个脚本,设置rnammer和hmmsearch的路径。

0 人点赞