Development and Validation of an Individualized Immune Prognostic Signature in Early-Stage Nonsquamous Non–Small Cell Lung Cancer
期刊:JAMA Oncology
IF:22.4
由于测序数据集之间潜在的生物学异质性和跨测量平台的技术的偏差,使用基因表达水平的传统方法需要适当的数据标准化。相反,基于基因表达相对排秩的方法消除了对数据预处理的要求,已证明在包括癌症分类在内的各种应用中均能产生可靠的结果。
免疫系统的各个组成部分已显示出是癌症起始和进展的决定因素。最近针对靶向特定免疫检查点PD1/PDL1的免疫疗法在NSCLC中表现出了显著的持久应答。
这项工作将多套基因表达数据集组合在一起,开发和验证非鳞状NSCLC的个体化预后标志基于免疫相关基因对(IRGP)。并且将免疫特征与临床因素相结合建立整合的预后指标。
数据:19套肺腺癌(NSCLC)公共数据集(18套GEO测序,1套TCGA的RNA-Seq),肿瘤冷冻样本的基因表达数据
其中3套用作独立验证集:TCGA lung adenocarcinoma (TCGA), Director’s Challenge Consortium(DCC), GSE30219
样本筛选:患者是非鳞状NSCLC,排除手术切缘阳性、接受新辅助化疗、辅助化疗或者由于其他药物疗法导致产生免疫调节作用
最终2414个患者样本
一、构建IRGPI:
基于 IRGPs构建个体化诊断标志:
(1)从ImmPort database (https://immport.niaid.nih.gov)下载免疫相关基因(IRGs)。
(2)生成免疫相关基因对score(IRGPs)
对样本构建离散化基因对矩阵:免疫相关基因两两组合配对,若基因1表达低于基因2,score为1,否则为0。(优势:用秩序关系,数据不用标准化)
(3)根据IRGPs对样本分类,用IRGPs进行生存分析,P<0.05的基因对用来建立IRGP index (IRGPI)。
(4)COX比例风险回归:最终选出25个IRGPs构成IRGPI,涉及40个免疫相关基因。
(5)ROC曲线:将患者分成高风险组和低风险组。
二、验证IRGPI作为stage独立的预后标志
根据IRGPI将患者划分高低风险组,低风险组预后好
A, 训练集 stage I患者分成高低风险组生存分析
C, 训练集 stage II患者分成高低风险组生存分析
B, 3套验证集 stage I患者分成高低风险组生存分析
D, 3套验证集 stage II患者分成高低风险组生存分析
多变量COX回归评估高低风险组,RIGPI可以估计非鳞状非小细胞肺癌的总体生存率,而与stage无关。
三、 IRGPI功能注释
对40个IRGs进行GO功能富集,富集到大多数生物学过程是趋化性(chemotaxis)。
(趋向性(Chemotaxis)亦被称为化学趋向性,生物对外界环境中的化学物质刺激所产生的趋向性反应。)观察到各种免疫浸润,如嗜中性粒细胞,单核细胞和巨噬细胞的趋化性。
TCGA数据集中,高风险组坏死细胞和嗜中性粒细胞浸润占比高
A, 高低风险组中速冻组织切片不同位置(top、bottom)坏死细胞占比情况。
B, 高低风险组中速冻组织切片不同位置(top、bottom)嗜中性粒细胞浸润占比情况。
在TCGA数据集中的2个IRGPI风险组之间,未观察到淋巴细胞或单核细胞浸润的统计学显着差异。
四、 与其他基因表达 signatures比较
将IRGPI与2种临床适用和商业化的生物标志物进行了比较,包括针对I至III期非鳞状NSCLC的14基因生物标志物和针对早期(I和II)NSCLC的31细胞周期进展(CCP)基因生物标志物。IRGPI与14个基因的生物标志物相比均获得了更高的C-index。在4个数据集中的3个数据集中,IRGPI显示的C-index高于CCP生物标志物。
(C-index,C指数即一致性指数(index of concordance),用来评价模型的预测能力)
五、 整合IRGPI与临床因素
整合年龄,stage和IRGPI拟合Cox比例风险回归模型,建立免疫相关的临床预后标志ICPI。ICPI为(0.0265×年龄) (0.267×阶段) (1.917×IRGPI得分)。
下图,在训练集和3套验证集中IRGPI和ICPI的C-index值分布,限制平均生存(RMS)曲线在所有ICPI数据集中显示出较大的斜率,表明使用ICPI可以更好地评估生存率。
将患有早期疾病的患者的ICPI与商业化的临床分子复合生物标记物mPS(将stage与CCP评分相结合)进行了比较。ICPI在所有验证数据集中均达到了更高的生存率估算准确性。
小编总结:回顾整个分析,本文的亮点是通过构建基因对的秩序关系消除了测序中的批次效应,进而通过生存分析、cox分析建立划分高低风险的基因对。是不是也可以把这种秩序关系的方法应用到我们的研究中呢~