导语
GUIDE ╲
乳腺癌是全球最常见的癌症之一,也是全球女性恶性肿瘤死亡的主要原因。肿瘤浸润性淋巴细胞是乳腺癌患者重要预后生物标志物的来源。
背景介绍
今天,小编给大家带来了在乳腺癌中基于免疫细胞特征构建预后模型分析的相关思路,这篇文章于2020年12月发表在《Briefings in Bioinformatics》期刊上,影响因子8.99,题目为:Clinical significance and immunogenomic landscapeanalyses of the immune cell signature basedprognostic model for patients with breast cancer.
数据介绍
从GSE9893、GSE3143、GSE1456(GPL96)、GSE10886、GSE7390、GSE20685、NKI、GSE22133、TCGA和METABRIC中收集的5102例乳腺癌患者作为训练数据集。从GSE10893(GPL887)、GSE48390、GSE20711、GSE10893(GPE1390、GPL1390)、GSE58812、GS812、GSE37751、CAL、STNO2、GSE16446、GSE42568、GSE22226和GSE45255收集的1313例乳腺癌患者用作测试数据集。
三个接受化疗的乳腺癌数据集(GSE18728、GSE5462和GSE20181),用于评估化疗反应中风险评分的效能。
抗PD-1和抗CTLA4治疗的恶性黑色素瘤数据集GSE91016。
结果解析
01
乳腺癌预后预测的免疫细胞特征
通过单因素Cox回归分析,评估了乳腺癌患者NESs与总生存率之间的预后关系。在155个免疫细胞特征中,选择了32个p值小于0.001的特征用于接下来的研究。接下来,通过最小λ值的LASSO Cox回归模型(Fig.1A、B),选择23个免疫细胞特征的NESs在训练数据集中建立IRRS模型。23个免疫细胞特征的浸润水平与整体存活率之间的关联见Fig.1C。
Fig.1
使用来自23个免疫细胞特征的NESs来绘制训练数据集的热图(Fig.1D)。说明了高低IRRS亚型之间显著不同的浸润水平。为了进一步评估IRRS的预后价值,通过对训练数据集进行KM生存分析来比较高IRRS和低IRRS亚型之间总体生存率的差异。如Fig.1E所示,高IRRS亚型患者的总体生存率明显低于低IRRS亚型患者。
02
用于nomogram构建的免疫细胞特征
为了为临床医生提供预测乳腺癌患者预后的定量方法,使用训练队列、测试队列和整个队列的患者构建了一个整合IRRS和亚型信息的nomogram图。根据本研究所示的nomogram图,可以计算出乳腺癌患者3、5和10年总生存率的评分。与子类型信息相比,IRRS贡献的风险评分最大(Fig.2A)。
图2B-D展示了训练队列、测试队列和整个队列校准曲线。训练队列、测试队列和整个队列的决策曲线见Fig.2E。我们能发现,三个队列的校准曲线拟合效果均不够理想,在决策曲线的测试队列中观察到10年生存率的效果最差。
Fig.2
03
高低IRRS患者的免疫landscape
Fig.3A中的热图显示了训练队列所显示的两种不同的免疫细胞浸润模式。低IRRS亚型的特征是CD103pos_mean_25446897、CD8 _PCA_16704732等等。而高IRRS亚型的特征是module11_prolif_score的高浸润和proliferation(Fig.3A)。
Wilcoxon test证实了两种亚型中除了CSR_Activated_15701700外,22个特征的免疫细胞浸润都有显著差异。使用TCGA队列的生存率分析显示,两种乳腺癌亚型之间的总体生存率有显著差异(Fig.3B)。
就内在分子亚型而言,LumB亚型患者在5个亚型中IRRS值最高,而正常亚型患者在5个亚型中IRRS值最低(Fig.3C)。然后研究了IRRS亚型中内在分子亚型的分布,并观察到内在分子亚型方面的不平衡(Fig.3D)。
随后研究了IRRS值和免疫相关特征之间的相关性。Fig.3E说明了IRRS值与CYT、基质评分、免疫评分和肿瘤纯度相关。此外,根据Wilcoxon test,两种IRRS亚型在CYT、基质评分、免疫评分和肿瘤纯度方面有显著差异(p值<2.20E-16)。研究了三个重要的免疫检查点分子,包括PD-1、PDL1和CTLA-4在TCGA乳腺癌队列中与IRRS的关联。TCGA队列的PD-1、PD-L1、CTLA-4的表达水平与IRRS值之间的成两相关关系高度相关(Fig.3E)。
用28个免疫细胞特征进行GSEA研究,以阐明在肿瘤微环境中enriched和depeted的特征(Fig.3F),在低IRRS亚型中高度表达的基因在多个T细胞特征中显示出显著的富集。Fig.3G、H表示在低IRRS亚型中高度表达的基因在多种免疫相关功能中显著富集,如免疫耐受性、免疫记忆、淋巴细胞计数、B淋巴细胞亚群、淋巴细胞亚群和T淋巴细胞辅助诱导剂。
对高低IRRS亚型之间进行转录差异分析,筛选到570个上调的差异基因,对其进行GO和KEGG分析,发现显著富集在免疫相关的过程和通路中(Fig.3I)。
Fig.3
04
高低IRRS亚型患者的免疫细胞比例分析
作者研究了高低IRRS亚型之间22种免疫细胞类型的免疫细胞比例的差异。利用具有1000个permutation的CIBERSORT算法,从标准化基因表达数据中推断出22种浸润性免疫细胞的免疫细胞比例。这两种IRRS亚型的肿瘤免疫细胞比例如Fig.4A所示,其分布如Fig.4B、C所示。
低IRRS亚型的B cells memory, T cellsCD8 , T cells CD4 memory resting, T cells CD4 memory activated, T cells follicular helper, T cells gamma delta,macrophagesM1, macrophages M2 and dendritic cells明显高于高IRRS亚型(P值<0.05;Wilcoxon test)(Fig.4C、D)。然而,在高IRRS亚型中plasma cells,macrophages M0,mastcells resting and mast cells的比例明显高于低IRRS亚型(P值<0.05;Wilcoxon test)(Fig.4C、D)。
Fig.4
05
IRRS值的治疗效益
在三个队列(GSE18728、GSE5462和GSE20181)中对接受辅助化疗的乳腺癌患者中IRRS的预测价值进行了分析。数据包括患者在辅助化疗治疗前后的mRNA表达水平。通过对三个数据集中的IRRS值进行配对比较,发现辅助化疗前后存在统计学显著差异(T-test)(Fig.5A)。
根据辅助化疗的反应,GSE41998的乳腺癌患者分为进展性疾病(PD)、稳定疾病(SD)、部分反应(PR)和完全反应(CR)。Fig.5B表明,在GSE41998数据集中,CR/PR乳腺癌患者的IRRS值明显低于SD/PD乳腺癌患者( Wilcoxon test)。
由于缺乏已公布的接受免疫治疗的乳腺癌患者的数据集。作者使用了接受抗PD-L1治疗的尿路上皮癌数据集(IMvigor210)和接受抗PD-1和抗CTLA4治疗的恶性黑色素瘤数据集(GSE91016)。IRRS值的最佳cutoffs由R包survminer确定,IMvigor210组和GSE91016组的患者分别分为高IRRS亚型和低IRRS亚型。KM曲线显示,IMvigor210(Fig.5C)和GSE91061组中低IRRS亚型患者比高IRRS亚型患者更好的预后更好。
进一步分析表明,与稳定或进展性疾病患者相比,完全或部分反应患者的IRRS值显著降低(Wilcoxon test)(Fig.5D)。
还验证了IRRS值在预测癌症患者的免疫治疗反应方面的有效性。对于每个有免疫治疗反应的队列,评估了在不同IRRS亚型中的CR/PR和SD/PD的分布。发现低IRRS亚型患者的免疫治疗反应比高IRRS亚型患者更好(Chi-squared test)(Fig.5E)。IMvigor210和GSE91061队列(Fig.5F)中的瀑布图也证实了IRRS值对检查点免疫治疗的预测价值。
最后通过IMvigor210和GSE91061队列中的时间依赖性ROC分析来评估IRRS值,以评估其在免疫治疗中的预测潜力。预后模型ROC曲线(AUC)下的区域IMvigor210组1年生存率为0.66、0.64和0.64(Fig.5G),GSE91061队列为1年0.74,1.5年0.69和2年0.67。
Fig.5
06
利用XGBoost算法预测高IRRS和低IRRS的子类型
为了构建能够预测乳腺癌的高IRRS亚型和低IRRS亚型的分类器,作者应用了XGBoost算法(R包xgboost)来构建模型,并选择了23种免疫细胞类型的NESs作为训练队列中的参数。在10倍的交叉估值中,SHAP contribution dependency plots和训练队列的五个重要特征的贡献如Fig.6A和B所示。训练组的总体准确性和AUC分别为86.98%和0.943(Fig.6C)。测试队列用于估计该模型分类新数据的性能。测试组的总体准确性和AUC分别为83.94%和0.947(Fig.6D)。
Fig.6
小编总结
作者通过利用多个公共数据库的乳腺癌数据集,通过Lasso Cox模型确定了23个与预后相关的免疫细胞特征,在训练数据集中确定打分系统,并构建了模型,在测试数据中证实模型的预后价值。作者还研究了风险评分与乳腺癌分子亚型、免疫检查点和免疫细胞丰度与对化疗和免疫治疗的反应之间的关系。结果表明,这个风险评分模型可以作为一个强大的预后生物标志物,为新的化疗和免疫治疗的发展提供治疗效益,并可能有助于为乳腺癌患者提供临床决策。