题目:计算机识别具有潜在膀胱癌预后和免疫治疗意义的肿瘤浸润B淋巴细胞lncRNA signature
一.背景知识
长链非编码RNA(lncRNA)是一类在细胞发育过程中起重要调控作用的非编码RNA。越来越多的证据表明lncRNA与免疫系统的发育和功能相关。不同免疫细胞亚群中lncRNA的出现频率也不同,具有细胞类型的特异性,且lncRNA的表达模式与TME中免疫细胞的浸润有关。然而,B细胞特异性lncRNA在预测患者预后和免疫治疗应答方面的潜在用途仍尚未得到阐明。膀胱癌(BCa)是最常见的癌症类型之一,根治性膀胱切除术以及放疗、化学疗法和免疫疗法已成为其治疗的主要手段,因此,BCa的风险分层和治疗反应预测需要更准确的分子生物标志物。
二.分析流程
三、结果解读
1.鉴别B细胞特异性的预后lncRNA
首先在B细胞系和其他免疫细胞系中进行lncRNA差异表达分析,基于FDR识别出141个lncRNA在B细胞系中高表达,而在其他免疫细胞系中低表达,为B细胞特异性lncRNA。然后在包括202个BCa患者的TCGA discovery dataset中,用单变量Cox回归分析这141个lncRNA的表达与生存时间的关系,鉴别出24个与生存时间显著相关的B细胞特异性lncRNA(P<0.05)。
2.在TCGA RNA-seq数据集鉴别和评估TILBlncSig预测预后的能力
为了从上述24个lncRNA中找到最适合预测的标志,在discovery dataset的202个BCa患者中对lncRNA表达和临床信息进行逐步回归(MASS包stepAIC函数)以及多变量回归,最终得到由8个B细胞特异lncRNA组成的signature并命名为TILBlncSig(图1)。为了应用到临床,把多变量Cox回归中TILBlncSig的coefficient加权转化为风险指数:TILBlncSig score= (−0.2438∗expression value of TNRC6C-AS1) (−0.3929∗expression value of WASIR2) (0.2234∗expression value of PART1) (−0.4645∗expression value of GUSBP11) (0.6849∗expression value of MAFG-DT) (0.4178∗expression value of LINC01184) (−0.3453∗expression value of OGFRP1) (−0.3408∗expression value of AC090515.2)。同时,多变量Cox分析也表明这8个lncRNA的预测能力是相互独立的。
图1.8个TILBlncSig
按上述风险指数计算discovery dataset中每个患者的TILBlncSig score,并用其中值(median value=0.1176)作为risk cutoff,将202个患者分为高表达组(n=101)和低表达组(n=101),生存分析表明低表达组OS延长,低表达组3年和5年生存率(89.7%和78.9%)显著高于高表达组(37.2%和31%)。然后在TCGA internal testing dataset中验证了TILBlncSig的预测能力。用相同的风险指数模型和risk cutoff 将201个患者分为高表达组和低表达组,生存分析表明低表达组的3年和5年OS(78.6%和75.8%)显著高于高表达组(50.6%),且ROC曲线显示出较好的区分度(图2)。多变量Cox比例风险回归分析的HR也表明TILBlncSig与OS显著相关(图3)。
图2.TCGA数据集中TILBlncSig的3年/5年OS ROC曲线
图3.TILBlncSig和临床病理因子的多变量Cox分析可视化
3.TILBlncSig与TIL-Bs关联
为了探索TILBlncSig的功能意义,计算了mRNA和8个TILBlncSig lncRNA表达之间的相关性,并筛选出前1%相关的mRNA为共表达的mRNA。这些共表达mRNA的GO和KEGG富集分析表明,TILBlncSig与免疫应答和肿瘤标志(cancer hallmark)相关的生物学通路高度相关(图4AB)。接下来,又结合免疫细胞特异性标志基因,进一步用single-sample GSEA评估了高表达组和低表达组患者的19个免疫亚群免疫浸润水平。如图4C,11个免疫亚群显著富集于高表达患者组,只有两个亚群(CD8 T-cell-activated和gamma-delta T-cells)富集于低表达组。其中,高表达患者中的单核免疫细胞(包括B细胞)尤其高表达于其他免疫细胞亚群。BCa细胞系数据中进一步的比较分析表明,与其他BCa细胞系相比,TILBlncSig中有4个lncRNA显著高表达于B细胞(图4D),表现出B细胞的表达特异性。上述结果共同表明,TILBlncSig不仅与预后相关,还具有TIL-B表达特异性。
图4.TILBlncSig的功能特征
4.TILBlncSig在微阵列平台多个独立验证集的预后能力
为了评估TILBlncSig的预测稳健性,进一步在微阵列平台的多个独立数据集中验证。在GSE31684(Affymetrix HG-U133_Plus 2.0 platform)的93个患者中,TILBlncSig仍可以区分患者生存的高低风险,高风险组预后低于低风险组(p=0.065,log-rank test)。单变量分析中,TILBlncSig也显示出与OS的紧密联系(图5)。
图5.GSE31684验证集验证TILBlncSig的预测效能
第二个独立数据集GSE5287( Affymetrix HG-U133A platform)中,只有1个TILBlncSig lncRNA(PART1),因此将30个患者分为PART1高表达组(n=15)和低表达组(n=15),如图6所示,基于PART1预测的KM生存曲线虽然没有显著的统计学差异,但是高PART1患者风险高于低表达组。这个趋势与发现集中的观察一致,表明lncRNA PART1是一个风险因子。(图6)
图6.GSE5287验证集验证TILBlncSig的预测效能
第三个数据集GSE38264(HuGene-1_0-st platform)包含了28个患者及4个TILBlncSig lncRNA(TNRC6C-AS1、PART1、GUSBP11和OGFRP1)。用同样的风险模型将患者分为高低表达组,比较了lncRNA的表达水平,发现其中3个lncRNA(TNRC6C-AS1、GUSBP11和OGFRP1)显著高表达于低表达组,而PART1相对低表达于高表达组,说明TNRC6C-AS1、GUSBP11和OGFRP1是保护性因子,而PART1是风险因子,与上述发现一致。
5.TILBlncSig与常规临床特征的独立性
为了进一步验证TILBlncSig是否为独立的预后因素,在三个BCa患者队列中进行多变量Cox回归分析(图7),协变量包括TILBlncSig和其他的常规临床因素。discovery和internal testing dataset的结果表明,TILBlncSig和疾病阶段(stage)是OS的独立预后因素。且GSE31684验证集的多变量分析中,TILBlncSig与OS仍保持显著相关性。因此可以得出结论,TILBlncSig是独立于其他常规临床因素的OS预测因子。
图7.TILBlncSig独立于其他临床特征
6.独立lncRNA和结合其他转录本的lncRNA预测能力比较
以往描述了由lncRNA,microRNA和蛋白质编码基因(PCG)组成的转录组特征预测BCa预后的能力。因此,又利用TCGA数据集中PCG、miRNA和lncRNA的表达数据,比较了PCG-lncRNA-microRNA后TILBlncSig的预测能力。
ROC曲线(图8A)显示,相同的TCGA数据中,TILBlncSig OS的3年和5年AUC(0.792和0.771)高于PCG-lncRNA-microRNA signature的3年和5年OS的相应AUC(0.588和0.594)。进一步比较Kaplan–Meier生存曲线(图8B),TILBlncSig预测的高风险评分患者预后比PCG-lncRNA-microRNA信号预测的高风险评分的患者预后更差,而TLBlncSig预测的低风险评分的患者预后较好。这些结果证明,TILBlncSig比PCG-lncRNA-microRNA标志具有更好的预后能力。
图8.PCG-lncRNA-microRNA signature和TILBlncSig的预测能力比较
7.TILBlncSig是预测免疫治疗应答的潜在因子
最后探索了TILBlncSig预测免疫治疗应答的能力。首先计算了TILBlncSig与免疫检查点基因(PD1和PD-L1)表达水平之间的关联。如图9A所示,TILBlncSig与免疫检查点基因表达呈显著正相关。进一步比较TILBlncSig分层的高危和低危人群中免疫检查点基因的表达模式发现,高危患者的免疫检查点基因表达水平明显高于低危患者组( Wilcoxon秩和检验)(图9B),这与先前的报道一致,即免疫检查点基因参与免疫抑制,其高表达与不良预后有关。为了进一步探索TILBlncSig和免疫检查点基因之间的cross-talk对患者生存的影响,基于TILBlncSig和免疫检查点基因的表达组合将患者分为四组,并比较生存率。比较结果显示,TILBlncSig能够显著区分具有相同或相似水平的免疫检查点基因的患者的生存(P = 0.001,对数秩检验)(图9C)。与其他三组相比,TILBlncSig低表达和免疫检查点基因高表达的患者预后较好,而TILBlncSig表达高和免疫检查点基因表达低的患者预测最差。此外,对于TILBlncSig低表达的患者,免疫检查点基因的表达水平与预后没有显著关联(PD-1 P=0.5,PD-L1 P=0.1,对数秩检验) 。而对于TILBlncSig高表达的患者,免疫检查点基因的表达水平与预后有显著关联(PD-1 P=0.04,PD-L1 P=0.09,对数秩检验),免疫检查点基因高表达患者预后更好。
图9.TILBlncSig于免疫检查点基因表达对患者生存的影响
观察到TILBlncSig与免疫检查点基因之间的关联后,假设TILBlncSig可以预测免疫治疗反应,在包含临床和转录组数据的ccRCC免疫疗法数据集中测试了TILBlncSig的预测价能力。同样,用TILBlncSig score的risk cutoff分组后,KM曲线表明抗PD-1单药治疗的高风险组和低风险组之间的生存率存在显著差异(图10A)。此外,免疫治疗应答的ROC曲线表明,TILBlncSig(AUC=0.609)与免疫检查点基因标记(PD-1 AUC=0.646,PD-L1 AUC=0.625)的预测能力相当。而结合PD-1表达后,TILBlncSig的区分能力提高(AUC从0.646增加到0.719)(图7B)。
图10.TILBlncSig预测免疫治疗应答的能力
小结
通过综合分析免疫、lncRNA和临床特征,从141个B细胞特异性lncRNA中鉴定出包含8个lncRNA(TNRC6C-AS1,WASIR2,GUSBP11,OGFRP1,AC090515.2,PART1,MAFG-DT和LINC01184)的TILBlncSig。 多个独立数据集验证表明,TILBlncSig能够独立于其他临床协变量而区分更差的预后。而功能分析表明,TILBlncSig在单核免疫细胞(自然杀伤细胞,B细胞和肥大细胞)中有浸润特异性,并且与癌症和免疫抑制表型有关。 此外,还分析了TILBlncSig与免疫治疗应答的关系,发现TILBlncSig能够预测抗PD-1治疗患者的生存预后和免疫治疗应答,且结合免疫检查点基因标记物后预测能力提高。 总的来说,这篇学习笔记从非编码RNA的角度强调了TILBlncSig作为TME中免疫细胞浸润的指标的价值,并加强了lncRNA作为免疫治疗反应的预测生物标志物的潜在应用,值得进一步探索。点击“阅读原文”可获取学习笔记原文。我们下期再见!