ENCODE V5 | 基因组调控预测数据库

2022-05-17 09:07:03 浏览数 (1)

之前我们介绍过关于[[ENCODE-转录调控必知数据库]]这个数据库。目前这个数据库更新到了V 5.0的版本。基本界面也发生了变化。所以这里就重新来介绍一下关于ENCODE: https://www.encodeproject.org/ 。

背景数据集介绍

ENCODE当中包括了多组学的数据。不同于TCGA多个肿瘤患者的测序患者。ENCODE的测序数据主要还是要探讨基因组上的多组学的变化。其中主要包括:

  • 转录因子 Chip-seq:了解转录因子对基因的调控作用;
  • 组蛋白 Chip-seq: 了解组蛋白修饰的情况
  • RNA绑定蛋白 ECLIP-seq: 了解RNA绑定蛋白的结合情况
  • DNA甲基化测序:了解DNA甲基化变化
  • DNase-seq, ATAC-seq: 了解染色体的开放程度
  • 转录位点活性检测 RAMPAGE:转录起始位点 (TSS) 的识别和转录表达的量化
  • ChiA-PET 和 Hi-c: 基因组在三维空间的变化
  • RNA-seq: GETx正常组织的基因表达结果

除了包括以上数据之外,ENCODE还综合了DNase-seq 和 H3K4me3、H3K27ac、 CTCF ChIP-seq测序内容最后汇总成一个一个顺式调节元件 (cis-Regulatory Elements, cCREs) 的结果。在cCREs当中,一共包括了五个顺势反应标签:promoter-like (PLS), enhancer-like (Distal enhancer-like (dELS), Proximal enhancer-like (pELS)), DNase-H3K4me3, and CTCF-only


数据库使用

新版本的ENCODE,基本上属于有了一个专门数据检索的界面。在主页界面当中,可以直接检索想要获取数据即可。比如我们搜索 CTCF,就可以获得和CTCF有关的数据

对于检索的结果。点击进去之后,也就和之前的版本差不多了。所以这里也就不做过多介绍了。有需要的可以看一眼[[ENCODE-转录调控必知数据库]]

除了基本的数据检索之外,在新版本的ENCODE当中,还包括了一个用来可视化cCREs的genome browser:SCREEN: Search Candidate Regulatory Elements by ENCODE: https://screen.wenglab.org/ 。

在这个里面可以搜索基因、染色体位置、SNP编号等。比如搜索:TP53。在结果里面,首先看到的是一个基因浏览器,里面包括了检索的内容和cCREs的关系。下面还包括了里面多个组蛋白修饰以及CTCF chip-seq的结果。

关于基因浏览器如何解读,可以查看[[UCSC Genome Browser-基因浏览器]] 如果对Chip-seq不了解。可以查看[[chip-seq是个什么东东]]

除了这个,还可以查看检索结果的基因表达情况以及转录因子活性

总的来说

以上就是ENCODE的新版本的内容了。里面主要是新开发了一个SCREEN工具。这个工具当中可以观察基因的cis调控的情况。

0 人点赞