使用circRNA_finder识别环状RNA

2019-12-19 15:10:22 浏览数 (1)

欢迎关注”生信修炼手册”!

circRNA_finder是一款环状RNA预测软件,在对果蝇的研究中采用该软件进行了环状RNA的预测,该软件的源代码托管在github上,网址如下

https://github.com/orzechoj/circRNA_finder

软件的安装比较简便,直接下载解压就可以了,需要注意的是,该软件依赖以下几个软件

  1. perl
  2. awk
  3. STAR
  4. samtools

其中samtools的版本必须是低于1.0的版本,因为两个版本samtools sort的用法有变化。软件的使用包含如下两个步骤

1. STAR比对参考基因组

STAR是一款转录组数据的比对软件,其支持嵌合体的比对方式,也就是说支持一条reads的两个部分比对到不同的基因组区域,而环状RNA的junction reads就是符合这样的要求,代码如下

代码语言:javascript复制
STAR 
--genomeDir hg19_star_db/ 
--readFilesCommand gunzip -c 
--readFilesIn R1.fastq.gz R2.fastq.gz 
--runThreadN 4 
--chimSegmentMin 20 
--chimScoreMin 1 
--alignIntronMax 500000 
--outFilterMismatchNmax 4 
--alignTranscriptsPerReadNmax 100000 
--twopassMode Basic 
--outSAMtype BAM SortedByCoordinate 
--chimOutType SeparateSAMold 
--outFilterMultimapNmax 2 
--outFileNamePrefix C1

虽然软件提供了一个名为runStar.pl的脚本,但是由于STAR的版本问题,使用起来并不方便。该脚本本质上是对STAR的封装,直接用STAR就好了,参数设置可以参考脚本中的设置。

2. 运行circRNA_finder

第二步就是预测环状RNA,代码如下

代码语言:javascript复制
perl 
postProcessStarAlignment.pl 
--starDir star_out_dir 
--minLen 100
--outDir output_dir

运行完成之后,会三个文件,对应的后缀如下所示

  1. _filteredJunctions.bed
  2. _s_filteredJunctions.bed
  3. _s_filteredJunctions_fw.bed

第一个文件为所有环状RNA的结果文件;第二个文件为剪切位点符合GT-AG剪切信号的环状RNA;第三个文件和第二个文件的环状RNA相同,只不过新增了环状RNA连接点附近的线性RNA平均测序深度信息。通常情况下,我们选择第二个文件的结果作为最终的环状RNA预测结果,该文件内容示意如下

每一行代表一个环状RNA,第一列代表染色体编号,第二列和第三列分别代表起始和终止位置,第四列代表name,这里用数字编号加上字母s表示,第五列代表环状RNA的junction reads数目,也就是表达量,第六列代表正负链信息。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

0 人点赞