灵活利用公共数据集构建预后模型也能发7分+!

2022-03-29 11:18:07 浏览数 (2)

导语

GUIDE ╲

乳腺癌患者的总生存率存在显著的异质性。目前的评估模型不足以准确预测患者的预后,也缺乏预测治疗反应的模型。

背景介绍

今天小编给大家带来一篇免疫浸润相关基因signature构建的文章。作者评估了各种免疫细胞与乳腺癌之间的关系,并证实免疫浸润与乳腺癌进展之间的关系。结合不同的生物信息学和统计方法,构建了一个强大的免疫浸润相关基因signature,用于预测患者的预后和对免疫治疗和化疗的反应。这篇文章于2021年发表在《frontiers in Immunology》杂志上,最新影响因子7.561,题目为:Construction and Validation of anImmune Infifiltration-Related GeneSignature for the Prediction ofPrognosis and Therapeutic Responsein Breast Cancer。

图1

数据介绍

ImmuCellAI:24个免疫细胞的浸润评分

TCGA:1007例乳腺癌患者的RNA-seq数据

METABRIC:1761例患者的基因表达信息

GEO:GSE20685(n=327)和GSE21653(n=266)数据集

CPTAC:基因水平的蛋白质组学数据

结果解析

01

预后相关的免疫相关基因特征的建立

基于免疫浸润评分进行单因素Cox回归分析,并对结果进行排序,确定乳腺癌的主要保护因素,包括TFh、CD8T、Tcm、MAIT、CD4T、NK、Tgd和Th2细胞(图2A)。Kaplan-Meier分析显示,免疫浸润评分较高的患者表现出更好的OS(图2B-I)。

图2

使用WGCNA分析全转录组分析数据和免疫浸润评分(图3A)。

基于WGCNA共识别出 24 个非灰色模块。在这些模块中,红色模块与被确定为乳腺癌保护因素的六种免疫细胞的浸润评分相关(图3B)。

在单因素Cox回归中,p值阈值为<0.05,确定出193个与预后显著相关的候选基因(图3C)。然后使用LASSO Cox回归模型来识别具有最稳定具有预后价值的基因。采用10倍交叉验证来克服过拟合,选择最优λ值为0.014(图3D)。鉴定出15个候选基因(SSYTL3、MS4A1、FAM92B、GBP2、LGALS2、SPIPK2、AMPD1、STAR、TDGF1、KLRC3、BCL2L14、CCL1、CCR9、CCL1、TAPBPL和FAM159A)的LASSO系数非零,并纳入基因signature模型(图3E)。signature中基因的LASSO系数的分布如图3F所示。

图3

02

训练队列中免疫相关基因特征的预后分析

作者对TCGA训练集中的IRS基因进行了预后分析。根据最佳cutoff,将1007个TCGA样本按-0.03分为高风险组和低风险组。进一步分析了该基因signature中15个基因的表达情况。除SYTL3被认为是风险基因外,低IRS组有14个基因表达高于高IRS组基因(图4A)。Kaplan-Meier曲线显示,高IRS组患者在训练组中表现出较差的OS(图4B)。

利用MSigDB中的“c5.go.v7.2.entrez.gmt”基因集,表明IRS组有不同的免疫群体,IRS低肿瘤中NK和T细胞趋化性和commitment基因的富集(图4C)。如图4D所示,主成分分析(PCA)显示,不同风险组的患者主要分布在两个方向上。相关性分析显示,这15个基因之间存在很强的相关性(图4E)。tROC分析显示这4个基因在15个特征基因中auc最高。(图4F)。

图4

03

乳腺癌中15个免疫相关基因signature的预后有效性

作者在3个独立的外部验证集中进一步证实。METABRIC、GSE21653和GSE20685队列的患者都被分配为高或低IRS组。基因表达热图如图5A-C所示。

三个外部验证集的分析结果都与训练集的分析结果高度一致。Kaplan-Meier分析显示,在3个验证队列中,高IRS比低IRS有更差的OS(图5D、E、F)。结合训练队列和三个验证队列,进行合并队列分析,将其分为两组的基因特征。如图5G所示,meta分析显示,所有IRS较高的患者都比IRS较低的患者预后更差。

图5

04

评估包含15个免疫相关基因signature的独立预后价值

在TCGA数据集中对15个IRS基因的signature进行单因素Cox回归和多因素Cox回归(图6A)。验证了该特征对乳腺癌的临床预后意义的独立性。风险评分在单因素Cox回归和多因素Cox回归中均有显著性意义。这些一致的结果也在METABRIC队列中得到了验证(图6B)。

图6

05

IRS高和IRS低患者之间的异质性

为了进一步研究两组患者之间的肿瘤异质性,并深入探讨两组患者之间肿瘤发生机制的差异,作者采用RPPAs分析了两组患者的主要通路。通过相关分析,发现IRS与肿瘤纯度、激素a评分、激素b评分和增殖评分呈显著正相关,与EMT评分和凋亡评分呈显著负相关(图7A)。作者希望研究上述通路评分是否显示乳腺癌高IRS组和低IRS组之间存在差异(图7B-G)。

图7

06

基因signature是免疫靶点和免疫治疗反应有价值的标志物

接下来,作者希望评估高IRS和低IRS组患者的免疫治疗反应。相关分析显示,estimated评分(图8A)、免疫评分(图8B)和基质评分(图8C)与IRS的Z-score呈负相关。大多数常见的免疫检查点基因与IRS的z-score呈负相关(图8D)。相关分析气泡图显示,TIMER的6个免疫浸润细胞评分(图8E)与TCIA的28个免疫浸润细胞评分(图8F)与IRS的Z评分呈负相关。图8G显示了IRS高组和IRS低组患者对免疫治疗反应的预测。当分别对免疫治疗应答组和无应答组进行生存分析时,发现IRS水平仍然可以预测两组的预后(图8H,I)。

图8

07

高、低IRS组乳腺癌患者的化疗反应

作者使用两种不同的方法来识别在高IRS患者中具有高药物敏感性的候选药物,使用了两种不同的药物反应数据库(CTRP和prism)。这些化合物与IRS均呈负相关,高IRS组的IRS estimated AUC值均较低(图9A,B为CTRP,图9C,D为prism)。

图9

08

建立一个针对乳腺癌患者的预测列线图

为了提供一种临床合适的方法来预测乳腺癌患者的OS概率,作者使用独立的危险因素来构建风险估计列线图(图10a)。这些预测因素包括年龄、肿瘤分期、PR状态、HER2状态、ER状态及与免疫浸润相关的风险评分。TCGA队列中3年和5年生存概率的校准图如图10B、C所示,表明列线图具有较高的准确性。此外,与其他特征相比,tROC分析显示,预测列线图是OS最准确的预测因子,平均AUC大于0.7(图10D)。

图10

小编总结

这篇文章中充分利用了多个公共数据库的数据进行分析,建立了一种新的免疫相关基因特征来预测乳腺癌患者的预后,并且加入药物信息预测了一些化疗药物可能更敏感的高危组,从而构建了一个列线图来量化个体患者的风险评估。

0 人点赞