欢迎关注”生信修炼手册”!
Cistrome的目标是提供一个基因组顺式作用元件分析的综合性数据库,通过收集来自GEO,ENCODE等公共数据库中的chip_seq, DNase_seq, ATAC_seq 原始数据,采用统一的分析方法,用bwa比对参考基因组,然后采用macs2进行peak calling, 将分析的结果加以整合,做成了在线数据库,整个数据库的构建过程和功能模块示意如下
网址如下
http://cistrome.org/db/
该数据库中收录的人和小鼠的相关数据汇总如下
从数量来看,cistrome可以说的上是收录的chip类型最多的数据库了。
通过首页的检索工具,我们可以查看特定数据分析结果,可以通过关键词检索,也可以通过物种,来源,因子类型一步步限定搜索范围,示意如下
在检索结果中勾选感兴趣的数据集,可以查看详细信息,以一个CTCF
转录因子的chip数据为例,结果包含以下几个部分
1. QC report
数据的QC情况,包括unique mapping比例,PBC, FRiP, peak在exon等基因组区域的分布比例等,示意如下
2. motif
motif分析结果,示意如下
点击每个motif的编号,可以查看详细信息,示意如下
3. putative target gene
潜在的靶基因,示意如下
同时还可以在基因组浏览器中查看数据的分布,也可以下载分析的结果文件,示意如下
ToolKit
菜单则提供了更加丰富的分析工具,具体如下
- 输入基因名称, 查看有哪些转录因子可能调控该基因
- 输入基因组区域,查看有哪些转录因子可能结合在该区域
- 输入peak结果,查看哪些转录因子的结果与你的输入结果有明显的overlap,可以用于转录因子的colocation分析
以第一个功能为例,输入基因,确定TSS上下游的范围作为潜在的调控区域,然后提交运行即可
除了table格式的结果外,还提供了图片形式的结果展现,示意如下
更多功能的用法和结果展示请移步官网自行探究。Cistrome DB是最为全面的人和小鼠的chip_seq数据库之一,通过该数据库,可以方便的分析和挖掘基因和转录因子的调控关系。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!