circBase:环状RNA数据库

2019-12-19 14:55:20 浏览数 (1)

欢迎关注”生信修炼手册”!

circBase是一个环状RNA的数据库,收录了人类,小鼠等多个物种的环状RNA信息,采用了find_circ软件来预测去核糖体文库中的环状RNA,该数据库的 网址如下

http://www.circbase.org/

在该数据库中,环状RNA的ID以物种的三字母缩写开头,比如hsa_circ_0018046,记录了circRNA的头尾在染色体上的为位置,来源基因,序列等信息。通过以下3种方式可以检索该数据库

1. 直接检索

在主页的检索框中,可以根据环状RNA的ID, 来源基因的名称,转录本名称等多种方式进行检索

检索结果示意如下

软件通过检测覆盖连接点两侧的reads来识别环状RNA,对于一个环状RNA,只能够给出其头尾在染色体上的位置和正负链信息, 检索结果中的genomic length对应的就是基因组上环状RNA头尾之间的长度。

同时还提供了环状RNA对应的染色体区域上的重复元件和基因组特征的注释。

对于环状RNA的序列信息,根据头尾的染色体位置去和已知的转录本进行比较,选择一个最佳的转录本,即best transciprt作为参照,然后确定剪切之后环状RNA的序列,从而得到spliced length。 需要注意的是,这种方式得到的序列只是一个生信预测的结果,后续还是需要实验手段来验证的。

检索结果支持导出xlsx, txt, csv等多种格式,也可以导出环状RNA的序列,示意如下

支持导出基因组序列和剪切之后的序列,还可以向上下游延伸。

2. 列表检索

通过导航栏的list search, 可以依次检索多条记录,示意如下

选择对应的物种,然后输入多个需要检索的ID即可。

3. table browser

和UCSC的table browser类似,提供了更加灵活的筛选策略,检索框示意如下

通过blat按钮,可以输入fasta格式的查询序列,然后和数据库中的circRNA序列进行比较,示意如下

查询结果如下所示

该数据库是免费下载的,可以下载物种对应的环状RNA的列表,也可以下载对应的序列,同时还提供了find_circ软件的源代码,可以用于分析自己的测序数据中的circRNA。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

0 人点赞