Hi-C技术源于染色体构象捕获(Chromosome Conformation Capture, 3C)技术,利用高通量测序技术,结合生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质三维结构信息。Hi-C技术不仅可以研究染色体片段之间的相互作用,建立基因组折叠模型,还可以应用于基因组组装、单体型图谱构建、辅助宏基因组组装等,并可以与RNA-Seq、ChIP-Seq等数据进行联合分析,从基因调控网络和表观遗传网络来阐述生物体性状形成的相关机制。 以下来自菲沙基因讲解视频的整理。原视频https://www.bilibili.com/video/BV1f7411n7zU?p=23
Hi-C与其他三维基因组技术特点
HiC技术实验原理
将三维基因组甲醛交联固定,用内切酶进行酶切,酶切完在末端加生物素进行末端修复,然后进行连接,连接后对去除蛋白并打断成小片段,用磁珠捕获带生物素的片段进行测序。
Hi-C分析流程
(a)首先是质控,过滤后高质量的FASTQ数据(PE,150bp),如果比对软件不支持split mapping的话,一般选用迭代比对,因为连接处由于是基因组外的碱基,可能比对不上。从序列左端25bp开始比对,如果有唯一比对,则停止,如果多个比对位置,则再继续延伸5bp,直到出现唯一比对。或者可以可以选择支持split mapping的软件进行比对,可以通过分段比对处理。 (b)选择高质量的比对数据 (c)HiC特异的比对标准 (d)对Vaild pairs进行矫正。矫正完可以得到互作矩阵。
Ferhat Ay et al;2015
Bryan R. Lajoie et al;2014
常用的分析软件
Software tools for Hi-C data analysis
Tool | Short-read | Mapping | Read | Read-pair | Normalization | Visualization | Confidence | Implementation |
---|---|---|---|---|---|---|---|---|
aligner(s) | improvement | filtering | filtering | estimation | language(s) | |||
:-- | :-- | :-- | :-- | :-- | :-- | :-- | :-- | :-- |
HiCUP [46] | Bowtie/Bowtie2 | Pre-truncation | ✓ | ✓ | − | − | − | Perl, R |
Hiclib [47] | Bowtie2 | Iterative | ✓ a | ✓ | Matrix balancing | ✓ | − | Python |
HiC-inspector [131] | Bowtie | − | ✓ | ✓ | − | ✓ | − | Perl, R |
HIPPIE [132] | STAR | ✓ b | ✓ | ✓ | − | − | − | Python, Perl, R |
HiC-Box [133] | Bowtie2 | − | ✓ | ✓ | Matrix balancing | ✓ | − | Python |
HiCdat [122] | Subread | −c | ✓ | ✓ | Three options d | ✓ | − | C , R |
HiC-Pro [134] | Bowtie2 | Trimming | ✓ | ✓ | Matrix balancing | − | − | Python, R |
TADbit [120] | GEM | Iterative | ✓ | ✓ | Matrix balancing | ✓ | − | Python |
HOMER [62] | − | − | ✓ | ✓ | Two options e | ✓ | ✓ | Perl, R, Java |
Hicpipe [54] | − | − | − | − | Explicit-factor | − | − | Perl, R, C |
HiBrowse [69] | − | − | − | − | − | ✓ | ✓ | Web-based |
Hi-Corrector [57] | − | − | − | − | Matrix balancing | − | − | ANSI C |
GOTHiC [135] | − | − | ✓ | ✓ | − | − | ✓ | R |
HiTC [121] | − | − | − | − | Two options f | ✓ | ✓ | R |
chromoR [59] | − | − | − | − | Variance stabilization | − | − | R |
HiFive [136] | − | − | ✓ | ✓ | Three options g | ✓ | − | Python |
Fit-Hi-C [20] | − | − | − | − | − | ✓ | ✓ | Python |
Hi-C可视化
image.png
数据分析
序列过滤
过滤原理
数据矫正
为什么要做数据矫正?
Eitan Yaffe & Amos Tanay;2011
数据矫正效果
可做的分析
1.cis/trans互作比例
2.互作频率与距离有关
3.compartment分析
4.TAD分析
5.显著互作分析
image.png
Hi-C的应用
1.解析全基因组互作模式
2.辅助提升基因组组装
3.构建基因组单体型图谱
参考: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4556012/ https://www.ncbi.nlm.nih.gov/pubmed/?term=Bryan R. Lajoie ; 2014 https://www.ncbi.nlm.nih.gov/pubmed/?term=Eitan Yaffe;2011 http://yulijia.net/cn/生物信息/2016/04/15/3C-4C-5C-HiC-ChIAPET-and-ChIPloop.html https://www.bilibili.com/video/BV1f7411n7zU?p=23 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4347522/ https://www.nature.com/articles/ng.947.pdf