之前我们介绍过关于[[ENCODE-转录调控必知数据库]]这个数据库。目前这个数据库更新到了V 5.0的版本。基本界面也发生了变化。所以这里就重新来介绍一下关于ENCODE: https://www.encodeproject.org/ 。
背景数据集介绍
ENCODE当中包括了多组学的数据。不同于TCGA多个肿瘤患者的测序患者。ENCODE的测序数据主要还是要探讨基因组上的多组学的变化。其中主要包括:
- 转录因子 Chip-seq:了解转录因子对基因的调控作用;
- 组蛋白 Chip-seq: 了解组蛋白修饰的情况
- RNA绑定蛋白 ECLIP-seq: 了解RNA绑定蛋白的结合情况
- DNA甲基化测序:了解DNA甲基化变化
- DNase-seq, ATAC-seq: 了解染色体的开放程度
- 转录位点活性检测 RAMPAGE:转录起始位点 (TSS) 的识别和转录表达的量化
- ChiA-PET 和 Hi-c: 基因组在三维空间的变化
- RNA-seq: GETx正常组织的基因表达结果
除了包括以上数据之外,ENCODE还综合了DNase-seq 和 H3K4me3、H3K27ac、 CTCF ChIP-seq测序内容最后汇总成一个一个顺式调节元件 (cis-Regulatory Elements, cCREs) 的结果。在cCREs当中,一共包括了五个顺势反应标签:promoter-like (PLS), enhancer-like (Distal enhancer-like (dELS), Proximal enhancer-like (pELS)), DNase-H3K4me3, and CTCF-only
数据库使用
新版本的ENCODE,基本上属于有了一个专门数据检索的界面。在主页界面当中,可以直接检索想要获取数据即可。比如我们搜索 CTCF,就可以获得和CTCF有关的数据
对于检索的结果。点击进去之后,也就和之前的版本差不多了。所以这里也就不做过多介绍了。有需要的可以看一眼[[ENCODE-转录调控必知数据库]]
除了基本的数据检索之外,在新版本的ENCODE当中,还包括了一个用来可视化cCREs的genome browser:SCREEN: Search Candidate Regulatory Elements by ENCODE: https://screen.wenglab.org/ 。
在这个里面可以搜索基因、染色体位置、SNP编号等。比如搜索:TP53。在结果里面,首先看到的是一个基因浏览器,里面包括了检索的内容和cCREs的关系。下面还包括了里面多个组蛋白修饰以及CTCF chip-seq的结果。
关于基因浏览器如何解读,可以查看[[UCSC Genome Browser-基因浏览器]] 如果对Chip-seq不了解。可以查看[[chip-seq是个什么东东]]
除了这个,还可以查看检索结果的基因表达情况以及转录因子活性
总的来说
以上就是ENCODE的新版本的内容了。里面主要是新开发了一个SCREEN工具。这个工具当中可以观察基因的cis调控的情况。