除了展示GTF, bed等常规格式的基因结构信息,IGV还可以展示RNA的二级结构,在下面这篇文章中,就是通过IGV的这一功能来直观的展示RNA二级结构
https://rnajournal.cshlp.org/content/23/7/1012.full.pdf
上图就是一个IGV的截图,其中的曲线展示的就是RNA的二级结构,一个典型的RNA二级结构示意如下
其中既有相互配对的碱基,也有单独的,未配对的碱基,形成了颈环结构。对于RNA二级结构的表示,有以下多种格式
1. DB(dot bracket)
用配对的圆括号来表示配对碱基,未配对的碱基用点号或者冒号来表示,而可能存在配对的碱基则用其他符号,比如{}
, <>
, []
来表示,示意如下
导入IGV时, 该格式对应的后缀为db。
2. CT(connectivity table)
软件RNAstructure所使用的文件格式,内容示意如下
第一行表示该RNA的碱基数目以及名字,其他行表示每个位置的碱基,第一列为碱基的下标N,第二列为具体的碱基符号,第三列和第四列分别为N-1和N 1, 第五列为与该碱基配对的碱基总数,第六列的值没有实际含义,和第一列保持相同即可。
除了上述两种结构外,IGV还支持其他的一些格式,详细内容请查看以下链接
http://software.broadinstitute.org/software/igv/RNAsecStructure
以db格式为例,导入IGV之后,会首先转换为IGV标准的bp
格式,示意如下
选择RNA所在的染色体名字,然后IGV会自动进行转化,导入之后,显示如下
右键可以调整曲线的颜色,方向等设置,这种方式有个缺点,就是只能统一设置颜色,无法单独进行调整,而通过bp
格式则可以完美解决这个问题,一个bp
格式的文件内容如下
首先是以colors开头的header部分,每一行指定不同的颜色,采用RGB编码,对应后面的3个数值,取值范围0到255, 最后的文字是可选的,看做label, 剩余的行在表示配对碱基所在的位置,最后一类的数值表示的是对应颜色的下标,从0开始计数。比如上述文件中,开头定义了两种颜色,分别用Low
和High
进行标识,下标分别为0和1,在配对碱基的行中,就用0和1来指定不同的颜色。
导入之后,显示如下
通过IGV, 可以灵活的展示RNA二级结构。