大家好!今天跟大家分享的文献是2020年12月发表在JOURNAL OF CELLULAR AND MOLECULAR MEDICINE(IF=4.486)杂志上的一篇文章。本研究分析TCGA,CGGA和GEO数据集和ER应激相关基因进行分析,构建ER应激相关风险特征,研究神经胶质瘤患者的免疫特征和预测患者预后。
题目:Characterization of an endoplasmic reticulum stress-related signature to evaluate immune features and predict prognosis in glioma
根据内质网应激相关特征评估神经胶质瘤免疫功能和预后
生信分析定制服务
摘要
内质网(ER)应激对各种癌症细胞的生长,增殖,转移,侵袭,血管生成和放化疗耐药性具有很大影响。然而,内质网应激对神经胶质瘤患者的影响还不是十分清楚。本研究,作者基于TCGA神经胶质瘤数据集构建ER应激风险模型,研究神经胶质瘤患者的免疫特征和预测患者预后。生存分析表明ER应激相关风险打分不同的神经胶质瘤患者的总生存期(OS)不同。此外,ER应激相关风险特征可以作为独立的预后因子。功能富集分析表明风险模型与免疫和炎症反应,生物合成和降解有关。总的来说,作者构建了ER应激风险模型,该模型可以作为独立的预后因子,揭示神经胶质瘤微环境的免疫特征。
流程图
结果
1. 数据的收集和获取
从GeneCards数据库收集ER应激相关基因。从TCGA和CGGA数据库收集RNA-seq数据和临床数据。从GEO数据库收集GSE16011数据集。
2. 鉴定到16个ER应激相关基因用于构建风险模型
从GeneCards数据库共收集到787个ER应激相关基因,对这些基因进行单因素Cox回归分析和KM分析。TCGA,CGGA,CGGA(mRNA-array)和GSE16011数据集分别鉴定到593,504,422和330个基因与OS显著相关(图1A)。对这些基因取交集,共得到190个基因,对这些基因进行LASSO回归分析(图1B和1C)。随后使用多因素Cox回归分析,构建基于16个基因的预后模型(图1D)。
图1 鉴定预后基因构建风险模型
3. 构建和评估ER应激相关风险特征
风险打分=(−0.1318 × CYP2E1) (−0.1122 × SLN) (0.4543 × BRCA1) (0.3481 × CISD2) (0.1811 × LRRK2) (−0.1236 × BMP2) (−0.1183 × MYH7) (0.4296 × HSPB1) (0.3839 × DNM1L) (0.5514 × SHISA5) (−0.5315 × RNF185) (0.2889 × RCN1) (0.1260 × SPP1) (0.5187 × RPN2) (−0.7779 × PDIA3) (0.2649 × ATP2A2) 。使用时间依赖性ROC曲线评估ER应激相关风险特征预测预后的效果。如图2A所示,TCGA数据集1年,3年和5年OS的AUC分别为0.89,0.929和0.9。CGGA数据集1年,3年和5年OS的AUC分别为0.719,0.795和0.804。GSE160011数据集分别为0.758,0.814和0.808(图2B和2C)。根据风险打分,将TCGA,CGGA和GSE16011数据集分为高风险组和低风险组。KM分析表明低风险组患者的临床结果更好(图2D-2F)。图2G和2H展示TCGA和CGGA数据集患者风险打分和生存时间的分布情况。这些结果表明ER应激相关风险特征预测患者生存情况的准确性。
图2 ER应激相关风险特征预测预后能力
4. ER应激相关特征与临床病理特征的相关性
作者研究ER应激相关风险特征是否与神经胶质瘤患者的临床病理特征有关。首先,作者进行KM分析研究风险特征对LGG和GBM患者预后效果。如图3A-3F所示,高风险组患者OS较低。此外,不同分组中的患者风险打分显著不同,高风险打分与IDH野生型,间充质亚型和MGMT启动子为甲基化有关(图3G-3N)。这些结果表明,ER应激相关风险特征可以准确区分不同临床病理特征的神经胶质瘤患者。
图3 ER应激风险打分可以区分不同临床病理特征的神经胶质瘤患者
5. 风险特征的功能富集分析
为研究不同分组下的ER应激状态,作者研究TCGA,CGGA和GSE16011数据集中ATF6,HSPA5,XBP1和ATF4等基因的表达水平。大多数基因在高风险组中高表达(图4A-4C)。为进一步研究风险打分与ER应激状态的关系,作者对风险打分中涉及的16个基因进行qRT-PCR。随后,作者使用Western blot研究ATF6,EIF2α,p-EIF2α和p-IREα在高打分组和低打分组的表达水平。使用这些结果进一步证实了风险特征与ER应激的相关性。作者对TCGA和CGGA数据集进行GSVA分析(图4D和4E)。
图4 风险特征的功能富集分析
6. 高ER应激风险打分具有免疫抑制功能
免疫系统对肿瘤消除过程涉及癌症-免疫循环。作者研究了TCGA,CGGA和GSE16011数据集中抑制该循环的基因的表达水平。大多数基因在高风险组中高表达(图5A-5C)。一些神经胶质瘤的免疫抑制因子在高风险组中过表达(图5D-5O)。此外,MDSCs,Tregs,NK等免疫抑制细胞富集在高打分组中(图5P-5R)。为进一步研究两个分组下的免疫微环境特征,作者使用ImmuneSubtypeClassifier将患者分为不同的免疫亚型。作者发现高打分组和低打分组中最常见的亚型为C4和C5,而高打分组中C4亚型的数量更多,C4亚型的预后较差。这些结果进一步证明ER应激相关风险特征预后预后和免疫亚型的准确性。
图5 不同分组下的免疫特征
免疫检查点同样可以抑制免疫细胞清除肿瘤的能力。作者比较了TCGA,CGGA和GSE16011数据集高风险组和低风险组免疫检查点的表达水平,结果表明大多数免疫检查点在高风险组表达量上调(图6A-6C)。对PD1和PD-L1的表达水平与风险打分进行相关性分析,作者发现PD1和PD-L1的表达水平与风险打分正相关(图6D-6G),且高风险组的表达水平较高(图6H-6K)。这些结果表明ER应激相关风险特征可以准确预测神经胶质瘤患者的免疫特征。
图6 ER应激风险特征和免疫检查点的相关性
7. 构建和验证列线图
接下来作者确定ER应激风险特征是否可以独立预测预后。TCGA数据集的单因素Cox分析表明ER应激相关特征与患者OS负相关。此外,年龄,分级,IDH突变情况和MGMT启动子状态与OS显著相关(图7A)。多因素Cox回归分析表明ER应激相关风险特征,分级和IDH突变情况与OS显著相关(图7B)。对CGGA和GSE16011数据集进行相同分析,结果与之一致。这些结果表明,ER应激相关风险特征是神经胶质瘤患者的独立预后因子。
作者基于ER应激风险特征,年龄,性别,WHO分级等特征构建列线图预测1年,3年和5年的OS(图7C)。校准图结果表明列线图的准确性(图7D和7E)。对TCGA和CGGA数据集构建DCA图,可以准确预测患者1年,3年和5年的OS(图7F-7K)。
图7 构建和评估列线图
结论
本研究分析TCGA,CGGA和GEO数据集和ER应激相关基因进行分析,构建ER应激相关风险特征。基于风险打分可以将患者分为高风险组和低风险组,高风险组预后较差。随后作者对ER应激风险特征进行富集分析和免疫相关分析,最后构建列线图。作者的研究为阐明内质网应激在神经胶质瘤中的作用提供了重要信息。本文的局限性在于ER应激风险特征有关基因的蛋白水平变化还需要进一步分析。此外,该模型在区分正常组织和癌组织的准确性仍有待研究。