玩转基因组浏览器之展示RNA二级结构

2020-05-07 16:26:12 浏览数 (1)

除了展示GTF, bed等常规格式的基因结构信息,IGV还可以展示RNA的二级结构,在下面这篇文章中,就是通过IGV的这一功能来直观的展示RNA二级结构

https://rnajournal.cshlp.org/content/23/7/1012.full.pdf

上图就是一个IGV的截图,其中的曲线展示的就是RNA的二级结构,一个典型的RNA二级结构示意如下

其中既有相互配对的碱基,也有单独的,未配对的碱基,形成了颈环结构。对于RNA二级结构的表示,有以下多种格式

1. DB(dot bracket)

用配对的圆括号来表示配对碱基,未配对的碱基用点号或者冒号来表示,而可能存在配对的碱基则用其他符号,比如{}, <>, []来表示,示意如下

导入IGV时, 该格式对应的后缀为db。

2. CT(connectivity table)

软件RNAstructure所使用的文件格式,内容示意如下

第一行表示该RNA的碱基数目以及名字,其他行表示每个位置的碱基,第一列为碱基的下标N,第二列为具体的碱基符号,第三列和第四列分别为N-1和N 1, 第五列为与该碱基配对的碱基总数,第六列的值没有实际含义,和第一列保持相同即可。

除了上述两种结构外,IGV还支持其他的一些格式,详细内容请查看以下链接

http://software.broadinstitute.org/software/igv/RNAsecStructure

以db格式为例,导入IGV之后,会首先转换为IGV标准的bp格式,示意如下

选择RNA所在的染色体名字,然后IGV会自动进行转化,导入之后,显示如下

右键可以调整曲线的颜色,方向等设置,这种方式有个缺点,就是只能统一设置颜色,无法单独进行调整,而通过bp格式则可以完美解决这个问题,一个bp格式的文件内容如下

首先是以colors开头的header部分,每一行指定不同的颜色,采用RGB编码,对应后面的3个数值,取值范围0到255, 最后的文字是可选的,看做label, 剩余的行在表示配对碱基所在的位置,最后一类的数值表示的是对应颜色的下标,从0开始计数。比如上述文件中,开头定义了两种颜色,分别用LowHigh进行标识,下标分别为0和1,在配对碱基的行中,就用0和1来指定不同的颜色。

导入之后,显示如下

通过IGV, 可以灵活的展示RNA二级结构。

0 人点赞