ATAC全称如下
Assay for Transposase Accessible Chromatin with hight-throughput sequencing
名字很长,翻译为转座酶可及的染色质区域的高通量测序。在这个冗长的名字中,高通量测序我们一点都不陌生,NGS二代测序已经发展了这么多年,各种组学技术,比如WES, WGS, RNA_seq等等,应用非常广泛。那么”转座酶可及的染色质区域”又是什么呢?这个词应该这样来理解,通过转录酶获取到的染色质可及区域。
转座酶是由转座子编码的一种酶,在NGS中用于文库构建,最常用的是Tn5转座酶,其随机性好,稳定性高,插入位点易测。通过转座酶, 只需一步反应就可以实现DNA的片段化,末端修复,接头连接,大大加快了文库构建的过程,illumina的Nextear系列试剂盒就是利用转座酶来进行文库构建。值得注意的是,相比其他超声等DNA片段化方式,tn5切割好的序列与adapter之间有9bp的gap需要补齐。
染色质可及,英文为chromatin accessibility, 即可以说是染色质的一种特性,也可以说是染色质上的一种特定区域。DNA缠绕在核小体上,通过高度折叠构成了染色质,这就是染色质的一维模型,绳珠模型。当细胞形式行使特定功能时,比如转录因子调控,基因转录等需要特定蛋白质结合到DNA上的过程,为了能够容纳蛋白质,需要将部分折叠的染色质区域”打开”,以方便这些蛋白质的结合。
将特定区域”打开”的特性就称之为染色质可及性,而打开的染色质区域称之为open chromatin, 也叫做开放染色质区域,与之相对的,其他未开放的区域称之为close chromatin,示意图如下
从染色质开放的原因可以看出,这些区域对于研究基因的表达调控至关重要。为了获取这些开放的染色质区域,科学家们也发明了各种方法,比如MNase-seq, DNase-seq, FAIRE等手段,但是这些技术缺点比较明显,实验步骤繁多,重复性差,需要的细胞量大,而ATAC_seq利用了Tn5转座酶来建库,实验步骤少,建库时间短,重复性好。
ATAC文库构建的过程示意如下
通过Tn5转录酶富集开放染色质区域的DNA序列,然后进行高通量测序。如上图所示,通过将测序得到的序列mapping回基因组,可以识别开放的区域在基因组上的具体位置,即peak区域。
和其他技术相比,ATAC识别到的信号如下
以上图片来自文献 Chromatin accessibility: a window into the genome
通过ATAC,可以一次性得到整个基因组上的开放染色质图谱,可以用于探究转录因子结合,基因表达调控等生物学过程。比较发育不同阶段,不同实验条件下,开放染色质图谱的变化,可以进一步探究特定的生物学机制,比如胚胎发育的不同阶段,肿瘤相对正常组织开放染色质图谱的变化等等。