欢迎关注”生信修炼手册”!
circBase是一个环状RNA的数据库,收录了人类,小鼠等多个物种的环状RNA信息,采用了find_circ软件来预测去核糖体文库中的环状RNA,该数据库的 网址如下
http://www.circbase.org/
在该数据库中,环状RNA的ID以物种的三字母缩写开头,比如hsa_circ_0018046
,记录了circRNA的头尾在染色体上的为位置,来源基因,序列等信息。通过以下3种方式可以检索该数据库
1. 直接检索
在主页的检索框中,可以根据环状RNA的ID, 来源基因的名称,转录本名称等多种方式进行检索
检索结果示意如下
软件通过检测覆盖连接点两侧的reads来识别环状RNA,对于一个环状RNA,只能够给出其头尾在染色体上的位置和正负链信息, 检索结果中的genomic length对应的就是基因组上环状RNA头尾之间的长度。
同时还提供了环状RNA对应的染色体区域上的重复元件和基因组特征的注释。
对于环状RNA的序列信息,根据头尾的染色体位置去和已知的转录本进行比较,选择一个最佳的转录本,即best transciprt作为参照,然后确定剪切之后环状RNA的序列,从而得到spliced length。 需要注意的是,这种方式得到的序列只是一个生信预测的结果,后续还是需要实验手段来验证的。
检索结果支持导出xlsx, txt, csv等多种格式,也可以导出环状RNA的序列,示意如下
支持导出基因组序列和剪切之后的序列,还可以向上下游延伸。
2. 列表检索
通过导航栏的list search, 可以依次检索多条记录,示意如下
选择对应的物种,然后输入多个需要检索的ID即可。
3. table browser
和UCSC的table browser类似,提供了更加灵活的筛选策略,检索框示意如下
通过blat按钮,可以输入fasta格式的查询序列,然后和数据库中的circRNA序列进行比较,示意如下
查询结果如下所示
该数据库是免费下载的,可以下载物种对应的环状RNA的列表,也可以下载对应的序列,同时还提供了find_circ软件的源代码,可以用于分析自己的测序数据中的circRNA。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!