各位小伙伴们大家好,这次给大家分享的文献是Prognostic implications of autophagy-associated gene signatures in non-small cell lung cancer,2019年12月发表在Aging杂志上,影响因子5.515。文章通过对自噬相关基因表达谱进行分析,得到与临床预后相关的特征基因,结合临床特征和自噬基因特征,进而预测NSCLC患者的生存率。
术语
AUC:ROC曲线下面积; C-指数:一致性指数; EGFR-TKI:表皮生长因子受体酪氨酸激酶抑制剂; GO:基因本体,在生物信息学领域中广泛使用的本体,涵盖细胞组分、分子功能、生物过程三个生物学方面; GEO:基因表达综合 GSEA:基因集富集分析 HR:风险比 KEGG:京都基因与基因组百科全书 LASSO:最小绝对收缩与选择算子 LUAD:肺腺癌 LUSC:肺鳞状细胞癌 NSCLC:非小细胞肺癌 OS:总生存 ROC:受者操作特征 TCGA:癌基因组图谱
一
研究思路
二
结果
2.1
TCGA肺癌样本预后特征的构建
从GeneCards数据库获取了149个自噬相关基因(基因相关分数大于7),去除TCGA肺癌样本(包括490个肺腺癌样本和488肺鳞状细胞癌样本)数据中不存在的XBP1基因,构建出148个自噬相关基因的表达谱,结合总生存OS,通过单因素cox回归分析得到了肺腺癌(LUAD)的25个与生存显著相关的基因和肺鳞状细胞癌(LUSC)的11个与生存显著相关的基因。(A) TCGA-LUAD存活相关自噬基因的森林图。(B) TCGA-LUSC存活相关自噬基因的森林图。(C) 25个基因在正常组织和LUAD组织中的差异表达。(D) 11个基因在正常组织和LUSC组织中的差异表达。
进一步通过Lasso回归得到LUAD的22个和LUSC的11个生存相关基因。TCGA-LUAD(A)中25个基因和TCGA-LUSC(B)中11个基因的LASSO系数分布。根据对数(lambda)序列生成系数剖面图。TCGA-LUAD(C)和TCGA-LUSC(D)套索模型中最优参数(lambda)的选择。(E) TCGA-LUAD队列中22个基因的遗传改变。(F) TCGA-LUSC队列中11个基因的遗传改变。
这些基因的功能、风险系数和相关性得分如下表所示。
根据每个基因的mRNA表达水平和风险系数,即每个自噬相关基因的mRNA水平与其多变量LASSO回归系数加权的线性组合,计算每个患者的风险得分。风险评分用于预测预后,以中位风险评分作为临界值,将患者分为高风险组和低风险组。绘制热图以显示高风险和低风险组的基因表达谱,TCGA-LUAD(A)和TCGA-LUSC(B)。TCGA-LUAD(C)和TCGA-LUSC(D)的危险评分分布、患者生存时间及状态,黑色虚线是将患者分为低风险组和高风险组的最佳界限。TCGA-LUAD(E)和TCGA-LUSC(F)的单因素Cox回归分析,风险因素与存活率之间关系的森林图。
多元Cox回归分析。自噬相关基因标记是TCGA-LUAD(A)和TCGA-LUSC(B)预后的独立预测因子。TCGA肺癌患者的Kaplan-Meier分析,(C) 高危评分与TCGA-LUAD患者总体生存率低有关,(D) TCGA-LUSC的高危评分与总体生存率低相关。受试者操作特征(ROC)分析操作系统对TCGA-LUAD(E)中22个基因风险评分和TCGA-LUSC(F)中11个基因风险评分的敏感性和特异性。TCGA-LUAD(G)和TCGA-LUSC(H)的分期和危险度评分联合应用比单独应用两者更能预测预后。
2.2
相关信号通路的鉴定
这里主要是研究TCGA-LUAD样本里的22个自噬相关基因的潜在信号传导途径,用这22个基因作为诱饵在TCGA-LUAD样本里勾出50个最常改变的相邻基因,然后对这72个基因做GO分析(图A)和KEGG分析(图C)。GO分析表明,这些基因可分为几个基本的生物学过程,包括生物调控、对刺激的反应、发育过程、细胞增殖、细胞增殖和生长,KEGG分析显示,72个基因主要与自噬、凋亡、EGFR酪氨酸激酶抑制剂(TKI)抵抗、泛素介导的蛋白水解、PI3K-Akt信号通路和VEGF信号通路有关。同时GSEA分析(图D)显示,改变的基因在几种常见途径中显著富集。我们发现高风险组与细胞周期、p53信号通路、DNA复制和泛素介导的蛋白水解显著相关。同时,低风险组与mTOR、VEGF、胰岛素信号通路以及溶酶体呈负相关。
2.3
独立肺癌样本中预后特征基因的验证
这部分是对之前利用TCGA数据所构建的模型在GEO数据集进行验证。Okayama包括226例原发性I-II期肺腺癌(GSE31210)患者。患者的风险评分从-58到-53(图A)。低危患者存活时间明显长于高危人群(图C和E)。Rousseaux包括293例I-IV期肺癌(GSE30219),包括71例腺癌、61例鳞状细胞癌、56例大细胞神经内分泌肿瘤、39例基底细胞瘤、24例类癌、21例小细胞癌和7例其他组织学。风险评分范围从-19到-15(图B)。即使在该混合型肺癌样本(图D和F),风险评分也表现良好。
在109名肺癌患者(GSE3141)的BILD样本中,风险较小的患者比生存风险高的患者(图A、C和E)。最后,Lee的研究(GSE8894)对138例IA-IIIB期非小细胞肺癌(腺癌和鳞癌细胞肺癌)患者进行了研究。低危组患者的OS高于高危组(图B、D和F)。总的来说,这些结果证实了这22个自噬基因特征也可以预测独立验证肺癌样本的存活率。
2.4
个性化预测模型
个性化预测主要是通过列线图这种稳健的工具,综合多个风险因素,来定量确定个人在临床环境中的风险。通过结合22个自噬基因特征、年龄、性别、T、N、M和TNM分期,生成一个列线图来预测3年和5年OS的概率。如图A所示,每一个因素都按照其对生存的风险贡献比例被分配了点。校准曲线表明,实际和预测的生存率非常吻合(图B和C),尤其是5年生存率。在GSE30219肺癌样本中验证了列线图,图D和图E分别给出了3年和5年的校准曲线。
三
结语
本篇文章以自噬为主题,利用TCGA、GEO等公共数据库,结合cox和Lasso回归,得到肺腺癌和肺鳞状细胞癌的预后特征基因,并通过列线图来实现个性化的模型预测,对肺癌患者的生存率进行预测,且预测效果良好。文章思路清晰,环环相扣,值得我们去借鉴与学习! 原文获取方式,后台回复关键词:自噬