导语
GUIDE ╲
胰腺癌是世界上预后最差的恶性肿瘤之一。铁死亡作为一种新的程序性细胞死亡,已被证明在肿瘤治疗中具有潜力。
背景介绍
作为前段时间的研究热点,铁死亡方向一直有不少文章产出,今天小编给大家介绍的一篇文章,基于已经报道的铁死亡相关基因,构建预后模型,并通过分析不同风险类型和免疫特征的差异,得到了很好的结果,文章题目为:A Prognostic Model of PancreaticCancer Based on Ferroptosis-RelatedGenes to Determine Its ImmuneLandscape and UnderlyingMechanisms。
数据介绍
TCGA:PAAD的RNA-seq数据和临床随访数据
GEO:GSE57495和GSE71729芯片数据(含生存时间)
结果解析
01
与预后差异一起识别差异表达的FRGs
作者收集了关于铁死亡的文献,获得了60个FRGs(铁死亡相关基因)。随后,对每个FRG,使用训练集和生存数据,使用R包生存Coxph函数构建单因素Cox比例风险回归模型,认为p<0.05为显著性差异。发现了7个具有预后意义的差异表达基因:CD44、FANCD2、MT1G、PTGS2、SAT1、TFRC和STEAP3。
02
基于LASSO的预测模型的构建
为进一步筛选与PAAD发生和预后相关的关键基因,采用R包glmnet,采用lasso回归分析筛选上述7个FRGs。值为−ln(lambda)的每个基因的系数的轨迹如图1A所示。通过5倍交叉验证建立了模型,每个lambda下的置信区间如图1B所示。风险评分如下:
图1
根据LASSO鉴定的6个基因的表达水平计算了每个样本的风险评分,并绘制了风险评分的分布(图1C)。使用R包timeROC对训练集的风险评分的预后预测进行ROC分析。分析了1、2和3年预后预测的分类效率(图1D)。为了进一步验证模型的有效性,对风险评分计算Z-score,将训练集样本分为高风险组(>0)和低风险组(<0),并显示各组间的生存曲线(图1E)。结果显示,高危组的生存概率显著降低。
03
TCGA中的验证集验证了预测模型的稳定性
为了验证6-gene特征模型的稳健性,基于与训练集相同的模型和系数计算TCGA验证集中每个样本的风险评分,并绘制风险评分分布。与训练集相似,较高的风险分数对应于更多的死亡。这6个基因的表达趋势与训练集一致(图2A)。ROC分析显示,验证集中模型的1年、2年和3年AUC分别为0.62、0.6和0.79(图2B)。最后,高风险组的预后明显低于低风险组(图2C)。
作者在TCGA PAAD队列的所有样本中验证了上述结果。随着风险评分的增加,患者的死亡人数增加,并且6个signature基因的表达水平持续增加(图2D)。该模型在所有样本中的1年、2年和3年AUC分别为0.66、0.69和0.77,显示出良好的长期生存率预测(图2E)。高风险组的预后明显低于低风险组(图2F)。
图2
作者使用GEO两个数据集作为外部数据集进行模型验证,得到了相同的结果(图3)。
图3
04
风险评分与临床特征的相关性研究
结果显示,风险评分与TNM分期、分级、性别、年龄无显著关系(图4A-G)。这里有一个明显的趋势:风险越高的分数与越高的阶段相关,分化程度越高的样本有越高的风险分数越高。第三阶段和第四级与其他阶段不一致,主要原因是这两个阶段的样本量较小,导致偏差较大。
作者基于TCGA数据库的临床随访信息进行了单因素和多因素Cox回归分析。这些临床指标包括年龄、性别、T期、N期、M期、分期、分级和我们的风险型分组信息。单因素cox分析结果显示,T期、N期和Risktype是影响预后的重要危险因素(图4H)。多因素Cox回归分析显示,风险型是预后的独立危险因素(图4I)。以上结果表明,作者的模型对预测PAAD患者的临床预后具有良好的预测能力。
图4
05
差异表达基因的鉴定及功能富集分析
作者确定了两组间的DEGs,以了解具有不同预后的高风险和低风险组的潜在机制。高风险组共鉴定出1287个上调基因和42个下调基因(图5A)。高风险组DEGs主要为表达上调基因。分别显示了每个类别中10个最显著丰富的terms(图5B-E)。
图5
对高风险组和低风险组进行GSEA检测,富集途径选择的阈值分别为p<0.05和FDR<0.25(图6A)。发现高发现组中有多种肿瘤相关通路富集,如MISMATCH_REPAIR、NOTCH_SIGNALING_PATHWAY、CELL_CYCLE、PANCREATIC_CANCER,这可能意味着高危组的不良预后是多种肿瘤通路的组合。此外,对TCGA PAAD队列样本进行了单样本GSEA,并计算了每个样本在不同通路上的ssGSEA评分。对ssGSEA与风险评分进行相关性分析,显示相关系数>为0.5的通路(图6B)。
图6
06
各组间免疫浸润程度的差异
为了探索作者确定的高风险和低风险组之间免疫浸润的差异,使用ESTIMATE、MCPcounter和CIBERSORT工具评估了整体免疫浸润和免疫细胞的差异。结果显示,各组间基质评分、免疫评分和估计评分均无显著性差异(图7A)。然而,在MCP方法中,高风险组的monotypic lineage和中性粒细胞显著增加(p<0.05),这说明高风险组有更强的炎症反应(图7B)。在CIBERSORT结果中,高风险组的天然B细胞、活化NK细胞和Tregs浸润均低于低风险组,说明与低风险组相比,高风险组的特异性和非特异性免疫反应受到抑制(图7C)。
作者比较了高风险组和低风险组中一些免疫检查点的表达差异。发现几乎所有的免疫检查点基因在高风险组中都表达上调。CD274、CD276、CD44、CD80、IDO1、PDCD1LG2的差异有显著的统计学意义(图7D)。
图7
07
风险模型与现有模型的比较
为了进一步验证作者的模型的有效性,比较了3种预后相关风险模型(7基因signature(Cheng)、6基因signature(Stratford)和9基因signature(Xu))与作者的模型的预测性能。发现这三种模型在TCGA数据上的1、2、3年AUC均低于本文的模型,说明具有良好的预测性能。
图8
小编总结
这类铁死亡相关基因的预后模型构建和免疫分析的文章之前也解读过,研究的思路和方法大致相似,但本文的模型通过与之前研究的模型进行比较,具有一定的优越性,这也可以给大家提供参考!