小RNA在基因表达调控中扮演着重要的角色。一直以来都是研究的热点之一,生信宝典在2017年曾推荐中科院遗传所王秀杰老师组的Psrobot小RNA分析系统,在这里,我们要向大家推荐另一款miRNA在线分析工具psRNATarget [http://plantgrn.noble.org/psRNATarget/home]。目前该工具仅支持在线使用。
psRNATarget被专门设计来鉴定小RNA的靶转录本通过(1)利用预先定义的评分模式去分析sRNA和靶点的互补配对程度(2)计算未配对时的能量 (unpairedenergy (UPE)
)值评估靶点的可及性。这款软件最初是2011年释放的,2017年升级了互补配对评分机制, 并禁用了UPE,可以在不显著增加结果输出的基础上发现更多的小RNA-靶基因对(miRNA-target pair)。另外,新的psRNATarget通过浏览器HTML5 API实现分块上传“大”数据。
分析界面
PsRNATarget由Submit small RNA,Submit targetcandidates,Submit small RNAs and Target三个板块构成,其中Submit samall RNAs and Target
可用于自有非模式生物的miRNA分析。
有数百个植物已报道的转录本和miRNA数据库可供选择
按照网站指示,上传所需文件,选择合适的参数与评分版本进行分析
程序运行中
Submit small RNA模式运行结果(可下载结果列表)
Submit target candidates模式结果(可下载结果列表)
目前,psRNATarget仅支持在线使用,对于大规模数据分析具有一定的局限性,如果想要利用本地运算资源进行相关高通量分析,可以使用psRobot。最后,通过合适的筛选,就可以进行后续的数据分析了。
psRNATarget运行相关注意事项与参数说明
用户上传小RNA序列格式要求
分析前,后端流程将检查上传的小RNA,主要包括miRNA和sRNA。检查标准如下:
- FASTA或short-tag生信分析过程中这些常见文件的格式以及查看方式你都知道吗?
- 上传最大数据大小*200M 想快速分割调整格式,试试Linux
- 长度小于设定的互补区(HSP)的序列舍弃。
- 序列最大值是25或设定的互补区长度加5
- 未鉴定的小RNA将会被流程所忽视
- 只有A,T,C,G,U被视为有效的碱基,其他碱基将被忽视。
- FASTA中的ID长度不超过50个字符
用户提交目标候选序列格式要求
用户在这一部分上传潜在靶基因。一个标准的转录本可以是一个cDNA
,EST
,unigene
,mRNA
,基因段。服务器将检索这些这些转录本中潜在的miRNA靶点。上传序列的格式要求:
- 一个有效的序列只能是FASTA格式
- 流程一次最多可以分析
5 M
的目标候选序列,最大提交大小为1000 MiB(真正的 1 G)。 - 单个目标候选序列的长度应该在
50 - 5M
之间,流程会忽略这个范围之外的序列。 - 只有A、T、C、G、U和N是有效的碱基;其他字符将被删除或更改为N。
- FASTA中的ID长度不要超过50。
NGS所获得的miRNA序列,用户应先把其转变成FASTA
或short tags
。用户需要缩减序列的长度来保证这些序列的长度保持在19到25
个碱基。进一步删除冗余数据降低文件的大小。
psRNATarget评分模式V1(2011)
评分模式v1(PMID:21622958)建立在早期基于一系列动物相关文献的得出的模型。这种方法的一个重要特点是种子序列的大小只有2-8bp
,并且没有对种子序列的错配数限制。在我们的早期研究中,如果最大期望设置为5.0
, V1
模式可以识别所有经过验证的miRNA-target对(通常是基于5’-RACE实验的鉴定)。在psRNATarget中,出于兼容性原因,我们将maximum expectations
的默认值设置为3.0。
psRNATarget评分模式V2(2017)
改进后的评分机制可以在不显著增加输出结果的同时发现更多的miRNA靶基因对。在V2版本中,种子序列长度扩展到了2-13 bp
,种子序列错配最大数(除了G-U
)被限制到了2个。默认最大期望值是5.0,并且禁用UPE(并不能带来好的结果),默认可以鉴定出已验证的miRNA-target对的93%,在同等cut-off值下,V1版只能鉴定86%。
定制化评分模式User-customized schema
用户可以通过改变参数来获得靶识别的特殊情况。例如,一些miRNA-target可能会匹配较长的INDEL,因此可以通过减少开放匹配(opening gap)的罚分来显示更多这样的匹配。在种子区域也可以增加额外的权重,使种子区域识别具有更大的权重。可以考虑mRNA二级结构对目标识别的影响来计算靶强度。
计算互补评分的长度 (hspsize)
程序会根据microRNA与转录本间的互补区域评估靶向得分,推荐的hspsize大小是19-20
。值得注意的一点是,评分策略将只对第一个碱基到第hspsize个碱基的错配进行罚分,之后的错配将会被忽略掉。另外,输入序列中长度短于hsp
值的序列会被删掉。
靶位点可及性
除了靶点(RNA互补的区段)本身,靶点两侧的mRNA需要在二级结构中处于开放状态以便miRNA和RISC复合体的结合。 Kerteszet al. (2007, PMID:17893677) 建议在进行靶点可行性分析时应该考虑靶点上游17个碱基,下游13个碱基。
翻译抑制
除了降解mRNA,植物miRNA也会抑制靶基因的翻译。这通常在互补域中心存在错配时发生(互补中心区是降解mRNA所必需的)。这种机制不同于动物miRNA的翻译抑制,后者也在翻译水平上抑制基因表达。
程序允许用户设置中心区域的坐标,其中任何不匹配都将被报告为可能的翻译抑制。
多个靶位点
two-hit
模型 (Axtell et al., 2005;PMID:17081978)揭示miRNA或ta-siRNA可能在特定靶转录本具有多个靶点(即互补区域) 以增强识别。预测结果中包含每个小RNA/目标对的目标位点数量。建议用户选择具有更多目标靶点的sRNA/target pair。
References:
http://plantgrn.noble.org/psRNATarget/help#maxexpectation
http://plantgrn.noble.org/psRNATarget/home
psRobot:植物小RNA分析系统
NGS数据的预处理生信分析过程中这些常见文件的格式以及查看方式你都知道吗?
https://blog.csdn.net/m0_37526672/article/details/80334595
建议引用文章
- Xinbin Dai, Zhaohong Zhuang and Patrick X. Zhao (2018). psRNATarget:a plant small RNA target analysis server (2017 release). Nucleic AcidsResearch. doi: 10.1093/nar/gky316. [PUBMED]
- Xinbin Dai and Patrick X. Zhao (2011). psRNATarget: a plant smallRNA target analysis server. Nucleic Acids Research 39(Web Server issue):W155-9.doi: 10.1093/nar/gkr319. [PUBMED]
- Xinbin Dai, Zhaohong Zhuang and Patrick X. Zhao (2011).Computational analysis of miRNA targets in plants: current status andchallenges. Briefings in Bioinformatics 12(2):115-21. doi: 10.1093/bib/bbq065.[PUBMED]