导语
GUIDE ╲
解析2021-2022新热点——年龄对肿瘤突变、免疫、biomaker的影响。
背景介绍
2021年到2022年初,cell reports、nature communications等子刊连续发表了多篇与年龄相关的肿瘤研究论文,包括2021年4月发表在nature communications的An integrative analysis of the age-associated multi-omic landscape across cancers,2021年8月发表在cell reports的Evaluating the impact of age on immune checkpoint therapy biomarkers,2021年12月发表在cell reports的Pan-cancer analysis reveals molecular patterns associated with age,2022年1月发表在nature communications的Age influences on the molecular presentation of tumours。这些指明了肿瘤生物信息学研究的一个崭新的方向。我们以最早的NC文章为例,为大家呈现作者的新颖研究思路。
数据介绍
使用TCGAbiolinks下载拷贝数变异的seg文件和TCGA的临床数据。
结果解析
01
年龄与基因组不稳定性、杂合性丧失等的关联
作者首先为基因组不稳定性打分。在泛癌症中,基因组不稳定性得分随年龄增加而增加(P=5.98E−07)(图1a)。
接下来,应用线性回归来研究评分与每种癌症类型的年龄之间的关系。在7种癌症类型中,年龄和基因组不稳定性评分之间存在显著的正相关(图1b)。具有最强显著正相关的癌症类型是低级别胶质瘤、卵巢癌、子宫内膜癌和肉瘤。即在这几种癌症类型中,基因组不稳定性水平随癌症患者年龄的增加而升高。
图1
基因组杂合性缺失(LOH)是指一个亲本等位基因的不可逆缺失,导致等位基因失衡,并导致细胞在各自基因的另一个剩余等位基因上产生另一种缺陷。本文中,年龄和泛癌的杂合性缺失存在显著的正相关(P=1.20E−21)。然而,这种关联在多元线性回归分析中不再显著(图1c)。
具体而言,六种癌症类型显示正向的关联,包括神经胶质瘤和子宫内膜癌等(图1d)。另一方面,肺腺癌、食管癌和肝癌的基因组杂合性缺失百分比与年龄呈负相关。这种负相关可能是由于吸烟情况(肺腺癌和食管癌)、种族(食管癌)和肿瘤级别(肝癌)的样本在年龄分布上的差异。
另外,作者使用logistic回归分析了年龄和全基因组倍增(WGD)之间的关系。其中,卵巢癌和子宫内膜癌显著正相关(图1e)。综上所述,年龄越大的肿瘤患者的基因组往往越不稳定。
02
年龄相关的拷贝数改变
作者使用线性回归来确定年龄和体细胞拷贝数改变(SCNA)评分之间的关系。与基因组不稳定性评分结果一致,年龄和SCNA之间最强的正相关在低级别胶质瘤、卵巢癌和子宫内膜癌中。另一方面,肺腺癌是唯一一种SCNA评分与年龄呈负相关的癌症类型(图2a),这可能是因为年轻的肺腺癌患者中存在吸烟者()。当只分析非吸烟者时,年龄和SCNA总得分之间没有显著相关性。
不同的SCNA分类(病灶水平和染色体/臂水平)可能通过不同的生物学机制产生。因此,分别分析了年龄和局点和染色体/臂水平SCNA评分之间的关系。大多数癌症类型显示了年龄和SCNA总体评分之间的显著相关性,同时也显示了年龄和染色体/臂水平和病灶水平SCNA评分之间的相关性(图2b, c)。
图2
作者进一步检查了年龄相关的复发性局灶性SCNA。共存在113个显著与年龄有关的区域,其中包括67个增加和46个损失类型(图3a)。子宫内膜癌发现了最多数量的显著区域,其次是卵巢癌和低级别胶质瘤(图3b, c)。
使用Pearson相关性研究了SCNA和基因表达之间的相关性。在先前确定的癌症驱动基因中,共有81个基因出现在至少一种癌症类型中的至少一个与年龄显著相关的灶区,并显示SCNA和基因表达之间的显著相关性(图3d)。
图3
综上,不同癌症类型的年龄和SCNA之间存在关联,并且这些区域含有几种已知的致癌基因。
03
与年龄相关的体细胞突变
突变负担随着年龄的增加已经被证实。作者通过对性别、种族和癌症类型进行多重线性回归调整,证实了年龄和突变负荷在泛癌中的正向关联(P=1.41E−37)(图4a)。在癌症特异性分析中,18种癌症类型通过线性回归显示出年龄和突变负荷之间的显著关系。这种突变负荷的增加主要是由C>T突变造成的。C>T突变在6种癌症类型中显示与年龄显著正相关,而C>T突变在3种癌症类型中与年龄显著负相关。
图4
只有子宫内膜癌显示突变负担与年龄呈负相关。作者在年轻子宫内膜癌患者中观察到高比例的高突变肿瘤(每外显子组有1000个非沉默突变)。来自年轻患者(年龄≤50岁)的38个肿瘤中有13个(34%)是高突变肿瘤,而来自老年患者(11%)的383个肿瘤中只有42个高突变肿瘤(P=0.0003)(图4b)。
微卫星不稳定性(MSI)是由DNA错配修复缺陷引起的一种独特的分子改变。高微卫星不稳定性(MSI-H)肿瘤作为高突变负荷肿瘤的一个子集出现。作者研究了年轻患者子宫内膜癌的高突变负载是否与MSI-H肿瘤的存在有关。使用多元logistic回归,发现MSI-H肿瘤与年轻子宫内膜癌相关(OR=0.9751, P= 0.0264)(图4c)。
癌症高突变的另一个来源是由于聚合酶ε (POLE)或聚合酶δ (POLD1)基因突变导致的DNA聚合酶校正缺陷。在年轻的子宫内膜癌患者中,POLE(OR = 0.9690,P=0.0243)和POLD1(OR = 0.9573,P=0.0177)突变都更普遍(图4d)。
04
致癌信号通路的年龄改变
上文已经在体细胞突变和SCNAs水平上确认了癌症驱动基因中许多与年龄相关的改变,所以进一步调查了年龄相关的模式是否也存在于特定的致癌信号通路中。
使用logistic回归调整性别、种族和癌症类型,发现10个信号通路中有5个与年龄呈正相关。这些通路中的基因在老年患者中改变更频繁,与总体突变和SCNA随年龄增加相一致(图5a)。在细胞周期和Wnt信号通路中发现了最强的关联。
接下来,应用逻辑回归来研究年龄和致癌信号改变之间的癌症特异性关联。总体而言,在15种癌症类型中确定了28种显著相关的致癌信号通路(图5b)。在五种癌症类型中,Hippo和TP53信号通路的改变与年龄显著相关,有正相关,也有负相关。在三种癌症类型中,细胞周期、Notch和Wnt信号都显示出随年龄变化的增加,包括低胶质瘤细胞周期通路的改变随着年龄的增长而增加(图5c)。另一方面,由于TP53基因突变,年轻患者TP53通路改变更为明显(图5c)。
图5
05
年龄相关的基因表达和DNA甲基化变化
除了年龄的基因组差异外,作者还研究了癌症中与年龄相关的转录组和表观遗传变化。所有基因中在所有癌症类型中,年龄对基因表达的回归系数与年龄对甲基化的回归系数呈负相关,说明基因表达和甲基化的整体变化随年龄呈相反方向。这支持了DNA甲基化在抑制基因表达中的既定作用。
作者重点分析了包含至少150个年龄相关差异表达基因和150个年龄相关差异甲基化基因的10种癌症类型,包括低级别胶质瘤、乳腺癌、子宫内膜癌、食道癌、乳头状肾细胞癌、卵巢癌、肝癌、急性髓系白血病、黑素瘤和前列腺癌。确定了泛癌之间的重叠基因(图6b, c)。
图6
作者进一步研究了4组基因甲基化与表达的相关系数:1)年龄相关差异表达和年龄相关差异甲基化基因的重叠基因,2)年龄相关差异甲基化基因, 3)年龄相关差异表达基因, 4)其他基因。结果显示,年龄相关差异表达和年龄相关差异甲基化基因的重叠基因在DNA甲基化和表达之间具有最大的负相关(图6d),这突出表明,癌症中年龄相关的基因表达变化至少部分受到DNA甲基化的抑制。
对上述基因进行基因集富集分析(GSEA),以获得表达和甲基化随年龄变化的生物学见解(图6e)。值得注意的是,一些GO富集在表达和甲基化变化中都富集了,但方向相反。在乳腺癌中富集的术语包括几个信号、代谢和发育途径。Wnt信号通路在老年乳腺癌患者中改变更为频繁(图5b),随着年龄的增长,基因表达下降,甲基化增加。还发现了许多免疫相关术语在几种癌症类型中富集,包括食管癌、乳头状肾细胞癌、肝癌和前列腺癌。
综上,作者系统地描述了不同癌症类型的转录组和甲基化与年龄的关系。结果表明,癌症中的基因表达随年龄的变化是由DNA甲基化控制的。这些变化反映了可能在肿瘤发展中起重要作用的生物途径的差异。
小编总结
这篇2021年发表在nature communications的文章,是年龄相关肿瘤生信分析中第一篇也是最有代表性的一篇。作者做了以下三点最主要的工作,包括与年龄相关的基因组不稳定性、杂合缺失、全基因组倍增、拷贝数改变、体细胞突变等,年龄相关的致癌信号通路,年龄相关的差异表达基因和差异甲基化基因。工作简洁突出,侧重点在于不同年龄人群的肿瘤存在什么样的差异和变化。除了年龄外,其他临床基线特征会对肿瘤产生怎样的影响呢,大家不妨尝试。
END