欢迎关注”生信修炼手册”!
circRNA_finder是一款环状RNA预测软件,在对果蝇的研究中采用该软件进行了环状RNA的预测,该软件的源代码托管在github上,网址如下
https://github.com/orzechoj/circRNA_finder
软件的安装比较简便,直接下载解压就可以了,需要注意的是,该软件依赖以下几个软件
- perl
- awk
- STAR
- samtools
其中samtools的版本必须是低于1.0的版本,因为两个版本samtools sort的用法有变化。软件的使用包含如下两个步骤
1. STAR比对参考基因组
STAR是一款转录组数据的比对软件,其支持嵌合体的比对方式,也就是说支持一条reads的两个部分比对到不同的基因组区域,而环状RNA的junction reads就是符合这样的要求,代码如下
代码语言:javascript复制STAR
--genomeDir hg19_star_db/
--readFilesCommand gunzip -c
--readFilesIn R1.fastq.gz R2.fastq.gz
--runThreadN 4
--chimSegmentMin 20
--chimScoreMin 1
--alignIntronMax 500000
--outFilterMismatchNmax 4
--alignTranscriptsPerReadNmax 100000
--twopassMode Basic
--outSAMtype BAM SortedByCoordinate
--chimOutType SeparateSAMold
--outFilterMultimapNmax 2
--outFileNamePrefix C1
虽然软件提供了一个名为runStar.pl
的脚本,但是由于STAR的版本问题,使用起来并不方便。该脚本本质上是对STAR的封装,直接用STAR就好了,参数设置可以参考脚本中的设置。
2. 运行circRNA_finder
第二步就是预测环状RNA,代码如下
代码语言:javascript复制perl
postProcessStarAlignment.pl
--starDir star_out_dir
--minLen 100
--outDir output_dir
运行完成之后,会三个文件,对应的后缀如下所示
- _filteredJunctions.bed
- _s_filteredJunctions.bed
- _s_filteredJunctions_fw.bed
第一个文件为所有环状RNA的结果文件;第二个文件为剪切位点符合GT-AG剪切信号的环状RNA;第三个文件和第二个文件的环状RNA相同,只不过新增了环状RNA连接点附近的线性RNA平均测序深度信息。通常情况下,我们选择第二个文件的结果作为最终的环状RNA预测结果,该文件内容示意如下
每一行代表一个环状RNA,第一列代表染色体编号,第二列和第三列分别代表起始和终止位置,第四列代表name,这里用数字编号加上字母s
表示,第五列代表环状RNA的junction reads数目,也就是表达量,第六列代表正负链信息。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!