导语
GUIDE ╲
今天为大家介绍2013年Nature Genetics、Nature、SCIENTIFIC REPORTS、Nature Methods和Nature Genetics发布的几项关于泛癌driver突变分析的研究。
背景介绍
肿瘤通过从一些涉及调控细胞身份、生存和基因组稳定性的关键通路基因的“driver”突变来获得选择性优势。然而,致瘤过程是mutagenic,可能有更多的“passenger”突变基因对细胞没有进一步的优势,使肿瘤暴露在机体的免疫监视之下。一些基因经常发生突变,而另一些很少发生突变。Pan-Cancer analysis通过对不同肿瘤类型的比较来改进其识别drivers突变的能力,从而更好地描述driver突变对肿瘤启动、增殖和扩散的作用途径。
01
突变和体细胞变异对肿瘤分类
Emerging landscape of oncogenic signatures across human cancers [1]
在肿瘤中观察到的复杂的体细胞改变景观通常是相对少量的功能性致瘤改变(有时称为drivers事件)的结果,其数量超过了非功能性改变(乘客事件),非功能性改变对肿瘤的发生和进展没有实质上的贡献。低信噪比(功能事件与非功能事件数量的比率)是数据挖掘或数据分析的主要挑战。
该工作提取了癌症中发生改变的数千个遗传和表观遗传特征,筛选出500个选定的功能性事件(selected functional events,SFEs)。使用这个思路,从12种癌症类型中得出了3299例TCGA肿瘤的层次分类。最上面的类以突变(M类)或拷贝数变化(C类)为主。这种区别在极端的基因组不稳定时最为明显,表明存在不同的致癌过程。在这种分级的顶部,确定了两个大小相似的主要肿瘤类别,每个类别都有不同的SFEs(图1a)。尽管在该工作的分类中没有将拷贝数变异和突变之间的区别作为分类特征,但这些特征事件主要是一类钟体细胞突变和另一类中的拷贝数变异(图1b)。对所选功能事件分布的进一步检查显示,拷贝数的改变和体细胞突变之间存在显著的反向关系,特别是在高度变异的肿瘤中(图1c)。
从第一个主要细分开始,递归地将网络模块化算法应用于C类和M类肿瘤及其子类。结果是将层次划分为若干层次的子类,这些子类在每个granularity 级别上具有不同的功能变化模式(图2)。TP53突变异常于这一趋势,TP53突变强烈富集在C类,符合早期TP53突变导致拷贝数基因组不稳定性。分裂成两个主要肿瘤类表明复发拷贝数变异和突变主要在肿瘤的不同子集。
02
体细胞拷贝数改变(SCNVs)如何影响癌症基因
Pan-cancer patterns of somatic copy number alteration[2]
确定体细胞拷贝数改变(SCNAs)如何促进癌症是一个重要的研究目标。本工作对TCGA Pan-Cancer数据集中4934例癌症的SCNA模式进行了分析。在37%的癌症患者中观察到全基因组加倍,这与其他类型的SCNA、TP53突变、CCNE1扩增和PPP2R复合物变异相关。染色体内部的SCNAs往往比端粒结合的SCNAs短,表明它们产生的机制不同。在140个区域观察到显著复发的局灶性SCNAs,其中102个区域不存在已知的癌基因或抑癌基因靶点,50个区域存在显著的基因突变。
来自相似血统的组织类型在SCNA峰区域往往具有相似的扩增和缺失率(图3a)。观察了鳞状细胞癌(头颈部鳞状细胞癌、肺鳞状细胞癌和膀胱癌)和生殖癌(卵巢和子宫内膜癌)与乳腺癌的簇状分布。扩增峰和缺失峰区域中与基因最相关的特征已知与癌症相关(图3b)。使用了GRAIL37在基因组的选定区域中寻找基因的共同特征。
03
识别driver的鲁棒性方法
Mutational heterogeneity in cancer and the search for new cancer-associated genes[3]
该描述了癌症基因组研究的一个基本问题:随着样本量的增加,由当前分析方法产生的公认重要基因的列表迅速增长到数百个。通过将突变异质性纳入分析,MutSigCV能够消除大多数明显的人工发现(造成的偏倚),并能够识别真正与癌症相关的基因。
分析了特定癌症类型患者的异质性。对27种癌症类型的分析显示,非同义突变的中值频率在不同癌症类型之间的差异超过1000倍(图4)。
04
显著突变基因
Mutational landscape and significance across 12 major cancer types[4]
为了识别在单个肿瘤类型和12种肿瘤类型中表现出阳性选择的基因,该工作使用MuSiC-SMG方法,来发现突变频率明显高于背景的基因。在基因表达数据和人工处理的指导下进行了系统分析,发现了127个显著突变基因(SMGs)。在12种泛癌类型的3281个总样本中,3053个(93%)在这127个SMGs中至少有一个基因发生了非同义突变。这些SMGs参与多种细胞过程,大致可分为20个类别(图5)。Top类别包括转录因子/调控因子(21基因)、组蛋白修饰因子(13个基因)、基因组完整性(13个基因)、RTK信号(9个基因)、细胞周期(7个基因)、MAPK信号传导(7个基因)、PI3K信号(6基因)、Wnt /β连环蛋白信号传导(58个基因)、组蛋白(3个基因)、泛素介导的蛋白水解作用(3个基因)和剪接(3个基因)(图5)。
05
结合多种阳性选择信号来识别癌症drivers
Comprehensive identification of mutational cancer driver genes across 12 tumor types[5]
可以通过检测肿瘤突变模式中的阳性选择信号来识别drivers基因。高频率的突变是这些信号中最直观的(由MutSigCV和 MuSiC检测)。其他互补信号包括:功能影响偏倚(OncodriveFM)、突变聚类(OncodriveCLUST),以及磷酸化位点突变过表达(ActiveDriver)(图6a)。该工作表明互补的方法组合可以确定一个全面和可靠的癌症drivers基因列表。该工作使用这五种互补方法,通过外显子组测序数据从TCGA的12种肿瘤类型中3205个肿瘤进行体细胞突变分析。使用 rule-based方法结合了这五种方法在整个Pan-Cancer数据集和每个肿瘤类型中识别的候选drivers程序列表。该分析结果识别了291个作用于这些肿瘤的高可信度突变癌症drivers基因(HCD)(图6b)。在这些基因中,有一些之前没有被确定为癌症的drivers基因。
其中有165个候选结果是不包括在CGC中的新发现。13个被选择的non-CGC,或新的癌症基因在它们的功能相互作用的背景下图(图7)所示。这些新的候选drivers基因与其他已经确定的癌症基因一起出现。
06
一个探索跨肿瘤类型的癌症drivers资源
IntOGen-mutations identifies cancer drivers across tumor types[6]
除了TCGA Research Network产生的数据外,还有其他一些致力于肿瘤基因组重测序的项目,包括国际癌症基因组联盟(International Cancer genome Consortium)的项目和其他独立项目。IntOGen-mutations platform(http://www.intogen.org/mutations/)总结了肿瘤发生过程中涉及的体细胞突变、基因和通路。
IntOGen-mutations方法集成了不同mutation-calling工作流分析的肿瘤基因组结果,可扩展到数十万个肿瘤基因组。包括OncodriveFM,是一种检测显著偏向具有高功能影响(FM偏差)的基因,无需估计背景突变率;OncodriveCLUST,选择基因突变相对于同义突变倾向于聚集在蛋白质序列的特定区域(CLUST bias)的基因。这两种工具都检测了阳性选择的信号,这些信号出现在肿瘤发展过程中被选择的基因中,因此可能是drivers因素。
分数随后被转换(使用transFIC14),以弥补基因之间基础耐受性的差异,并且根据结果类型和transFIC突变评估评分,每个突变被分为四大类影响,范围从“None”到“High”(图8a)。该工作分析了来自31个不同项目的4623份样本的体细胞突变,涵盖了13个解剖部位(主要来自ICGC和TCGA)。
对已测序的肿瘤基因组进行系统分析,可以更广泛地了解不同癌症类型的基因在肿瘤发生中的影响。例如,TP53、ARID1A、KRAS或PIK3CA经常发生突变,并在大多数癌症位点被确定为癌症drivers因子。其他基因,如肾脏中的VHL,乳房中的MAPK3和GATA3,肺中的STK11,似乎是肿瘤特异性的主要drivers因素。
pipeline的结果将自动加载到由Onexus框架管理的Web浏览器中。研究结果可通过网络和Gitools交互式热图进行浏览。pipeline可以下载,也可以在服务器上在线运行。它可用于新测序的肿瘤样本组中识别drivers,并解释在肿瘤样本中观察到的突变。
07
常见的突变的进程引起drivers显著突变
(1)Evidence for APOBEC3B mutagenesis in multiple human cancers[7]
在大多数人类癌症中,会产生成千上万的体细胞突变,而它们的原因在很大程度上尚不清楚。最近发现,在表达DNA胞苷脱氨酶APOBEC3B酶的乳腺癌中,APOBEC3B占突变负荷的一半。该研究讨论了APOBEC3B是否对多种肿瘤类型的突变负责。分析了19种不同癌症类型的基因表达数据和突变模式、分布和负荷,其中有超过4800个外显体和1000000个体细胞突变。
结合该工作提供的全面的表达的数据分析(图9)、CG碱基对突变频率(图10)、局部胞嘧啶突变特征(图11)、整体突变负荷(图12)和kataegis(图12 c),所有可用的数据得出结论APOBEC3B是一个多种人类癌症的突变的主要来源。
(2)An APOBEC cytidine deaminase mutagenesis pattern is widespread in human cancers[8]
在乳腺癌中,HER2-enriched亚型在具有APOBEC突变模式的肿瘤中明显富集,表明这种突变与癌症的发生有功能关联。APOBEC突变模式也延伸到癌症相关基因,意味着APOBEC-mediated的突变是致癌的。
与未检测到APOBEC突变模式的样本相比,在高APOBEC存在的样本中,APOBEC特征突变在致癌突变中发生的频率更高(图13)。
小编总结
基因突变对于肿瘤的发生发展至关重要,相关的工作也层出不穷。区分“passenger”突变基因和“driver”突变基因也一直是在研究的问题。上面这些文章都是从泛癌角度多肿瘤突变进行分析描述,建议大家可以去浏览一下感兴趣的文章哦,里面的绘图和分析都很值得我们借鉴!
引用:
[1]. Ciriello G, Miller ML, Aksoy BA, Senbabaoglu Y, Schultz N, Sander C. Emerging landscape of oncogenic signatures across human cancers. Nat Genet. 2013;45(10):1127-1133. doi:10.1038/ng.2762
[2]. Zack TI, Schumacher SE, Carter SL, et al. Pan-cancer patterns of somatic copy number alteration. Nat Genet. 2013;45(10):1134-1140. doi:10.1038/ng.2760
[3]. Lawrence MS, Stojanov P, Polak P, et al. Mutational heterogeneity in cancer and the search for new cancer-associated genes. Nature. 2013;499(7457):214-218. doi:10.1038/nature12213
[4]. Kandoth C, McLellan MD, Vandin F, et al. Mutational landscape and significance across 12 major cancer types. Nature. 2013;502(7471):333-339. doi:10.1038/nature12634
[5]. Tamborero D, Gonzalez-Perez A, Perez-Llamas C, et al. Comprehensive identification of mutational cancer driver genes across 12 tumor types. Sci Rep. 2013;3:2650. Published 2013 Oct 2. doi:10.1038/srep02650
[6]. Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identifies cancer drivers across tumor types. Nat Methods. 2013;10(11):1081-1082. doi:10.1038/nmeth.2642
[7]. Burns MB, Temiz NA, Harris RS. Evidence for APOBEC3B mutagenesis in multiple human cancers. Nat Genet. 2013;45(9):977-983. doi:10.1038/ng.2701
[8]. Roberts SA, Lawrence MS, Klimczak LJ, et al. An APOBEC cytidine deaminase mutagenesis pattern is widespread in human cancers. Nat Genet. 2013;45(9):970-976. doi:10.1038/ng.2702