【生信文献200篇】67 CHIP-Atlas数据库

2021-10-12 15:27:35 浏览数 (1)

00 文章信息

英文标题: ChIP-Atlas: a data-mining suite powered by full integration of public ChIP-seq data

中文标题: ChIP-Atlas:完全集成了ChIP-seq公共数据的数据挖掘套件

期刊:EMBO Rep.

影响因子: 8.804 发表时间: 2018-11-09

研究领域: ChIP-seq 网页工具

DOI: 10.15252/embr.201846255

01 关于ChIP-Atlas

ChIP-Atlas是一个用于可视化和利用ChIP-seq公共数据的综合和全面的数据库。研究人员充分整合了6个代表性模式生物(人、小鼠、大鼠、果蝇、线虫和芽殖酵母)的公共 ChIP-seq和DNase-seq数据(n > 7万)。ChIP-Atlas能够显示归档在NCBI SRA中的所有公开ChIP-seq和DNase-seq数据的比对和峰值调用结果,其中包括GEO、ArrayExpress、DDBJ、ENCODE、Epigenomics等。所有峰值调用数据被整合,以可视化多个组蛋白修饰和转录调控因子(TRs)在给定基因组位点的结合位点。并且整合的数据可以进一步分析,以显示TR-gene和TR-TR相互作用,以及检测蛋白质结合的富集,给定多个基因组坐标或基因名。ChIP-Atlas可跨越数千个ChIP-seq实验进行数据挖掘。

02 CHIP-seq

染色质免疫沉淀测序(ChIP-seq)是一种分析修饰组蛋白、RNA聚合酶和其他参与转录或基因表达调控的蛋白的全基因组结合的方法。

其实验流程是:

  • 先通过甲醛交联:使目标蛋白与染色质连结在一起;
  • 提取基因组DNA并将其打断成小片段;
  • 添加与目的蛋白特异结合的抗体,该抗体与目标蛋白形成免疫沉淀复合体。
  • 去交联:将蛋白和DNA片段分离开,提取DNA序列,进行测序。

03 ChIP-Atlas开发流程

3.1 数据来源及分布

上图ChIP-Atlas中记录的ChIP-seq和DNase-seq实验数量(截至2018年5月),表明每个物种来自ENCODE, Roadmap Epigenomics, 和其他项目,并统计了数据具体信息。

3.2 数据分析流程

研究人员从NCBI SRA下载原始序列数据,采用sratoolkit转换成fastq, 然后用bowtie2比对参考基因组,用macs2进行peak calling,峰值调用,分析TR-gene (目标基因)或TR-TR(共定位)交互作用,并进行富集分析。

3.3 与其他CHIP-seq数据库比对

ChIP-Atlas 数据库相较于其他CHIP-seq分析数据库,其数量更多,数据来源更广泛,使用的模式生物更多。并且,该数据库最近的一次更新在2021年1月份。

04 使用ChIP-Atlas

该数据库主要分为四个功能:(1) Peak Browser;(2) Target Genes;(3) Colocalization;(4) Enrichment Analysis。并且该数据库的开发人员还很暖心的在每个功能中添加了教学视频,只可惜视频链接在YouTube上。

4.1 Peak Browser

Peak Browser:主要用于查看不同物种/组织/细胞、不同抗体的Peak结果,可以直接在网页上浏览IGV结果,也可以通过下载BED文件再进行进一步的分析。

IGV教程:保姆级 IGV 基因组浏览器使用指南(图文详解)

4.2 Target Genes

主要功能:预测指定转录因子结合的靶基因。其中参数"Distance from TSS"是指TSS (transcription start site,转录起始位点) 上下游的区间,用于设置筛选范围。

TSS是指一个基因的5'端转录的第一个碱基,它是与新生RNA链第一个核苷酸相对应DNA链上的碱基,通常为一个嘌呤(A或G)。

结果可以直接选择下载TSV文件,也可以选择“View Potential Target Genes” 进行查看,如图:

4.3 Colocalization

Colocalization分析:主要是预测与指定转录因子共定位的 partner proteins。针对于以蛋白复合体形式在基因上行使功能的转录因子。

其可视化结果也较为简单,可以下载TSV或GML进一步可视化:

4.4 Enrichment Analysis

预测与特定基因座和基因结合的蛋白质。即该部分是直接查询基因名称或者基因组区域,从而查找可以结合的转录因子。

其结果将会以网页及TSV格式展示:

html形式:

05 数据下载/详细文档

研究人员提供了更详细的数据库说明文档,并且将数据公开放置在文档中。可以通过点击“Documentation”进入研究人员的GitHub界面,其最近一次编辑在2020年9月21日。


【胡乱叨叨】ChIP-Atlas数据库操作简单易上手,并且研究人员不断进行数据库的更新和维护,是CHIP-seq初学者可以持续关注的数据库。并且该数据库的结果多以表格形式呈现,有利于研究人员进行CHIP-seq的深入分析或进行结果整理。

如果您已经有了生信基础,推荐→ 最适合ChIP-seq实战的文献推荐

0 人点赞