小编今天解读的这篇文章是2020年发表在DNA AND CELL BIOLOGY(影响因子3.191)上,题目为Identification of a 14-lncRNA Signature and Construction of a Prognostic Nomogram Predicting Overall Survival of Gastric Cancer。本文构建了包含lncRNA特征和临床因素的列线图,以预测原发性胃癌患者的OS,结果表明,风险特征和列线图均是GC患者的有效预后指标。
01
摘要
异常的长链非编码RNA表达在胃癌(GC)的发生和发展中起着至关重要的作用。因此,作者旨在开发基于lncRNA的风险特征图和列线图,以预测GC患者的总生存期(OS)。使用341个TCGA (STAD)中具有临床和lncRNA表达数据,内部验证数据集由172名随机的患者组成,外部验证数据集由300个GSE62254的患者组成。作者开发了风险特征和列线图,并在验证队列中进行了验证。此外,基因集富集分析(GSEA)用于研究风险特征的通路富集。作者还从10名GC患者的临床样本中研究了几种lncRNA的表达模式。作者识别并验证了与GC患者的OS高度相关的14-lncRNA标记,该标志在C指数,曲线下面积和校准曲线的评估中表现良好。此外,单因素和多因素Cox回归分析表明,lncRNA特征是GC患者的独立预测因素。这些结果表明,风险特征和列线图均是GC患者的有效预后指标。
02
流程图
03
结果简述
1. 患者临床病理因素和DELs(差异表达LncRNA)
内部和外部验证队列中患者的重要临床病理特征如下表所示:
根据log2FC>2的标准和adjust p <0.05,识别出124个DEL,包括90个上调的lncRNA和34个下调的lncRNA,如下表和下图所示:
2.风险特征识别
为了确定与OS相关的DEL,通过单变量COX比例风险回归在主要队列中分析了124个已确定的DEL,确定了16个DEL(p <0.05)。然后,使用lasso Cox回归模型进行10倍交叉验证,以分析其在主要人群中的表达,如下图B、C所示。
最后,识别出14个DEL与预后相关的lncRNA,并用于开发风险特征。Risk score = (XADAMTS9-AS2 · 0.0675) (XFLG-AS1 · 0.0270) (XRNF144A-AS1 · 0.0333) (XLINC00922 · 0.0022) (XC15orf54 · 0.1270) (XLINC01210 · -0.1526) (XERVMER61-1· 0.0227) (XPOU6F2-AS2 · 0.0122) (XLINC00973 · 0.0269) (XERICH3-AS1 · 0.1354) (XLINC00326 · 0.0406) (XLINC01208· 0.0651) (XLINC00645 · 0.0359) (XDSCR10 · 0.0512)。作者绘制了14个已确定的DEL的表达模式,风险评分分布和生存状况,如下图所示,热图显示13个高风险DEL(ADAMTS9-AS2,FLG-AS1,RNF144A-AS1,LINC00922,C15orf54,ERVMER61-1,POU6F2-AS2,LINC00973,ERIC3-AS1,LINC00326,LINC01208,LINC00645和DSCR10)在高风险组过表达, 1 DEL(LINC01210)在低风险组过表达:
作者进一步开发了将14种lncRNA纳入危险信号的预后列线图,如下图所示:
3.风险特征评估
Kaplan–Meier生存分析表明,在训练集和内部及外部验证集中,高风险组患者的OS短于低风险组。如下图B所示。在训练队列中,针对1年,3年和5年OS的风险特征的AUC-ROC分析分别为0.669、0.737和0.737。在内部验证队列中,对于1年,3年和5年OS,14-lncRNA特征的AUCROC分别为0.678、0.780和0.761。在外部队列中,1年,3年和5年OS的风险特征的AUC分别为0.559、0.709和0.731,如下图C所示。ROC分析表明,在三个队列中,对于5年OS,与仅单个lncRNA相比,风险信号具有更好的预测性能,如下图D所示。此外,三个队列的5年OS的风险特征校正曲线的预期结果与观察结果之间有相对较好的一致性,如下图E所示。C指数在训练人群中为0.667,在内部人群中为0.701,在外部人群中为0.624,如下图F所示。
单因素和多因素COX风险比例模型分析表明,特征是GC患者的独立预测因素。如下图所示:
4.列线图的开发和验证
单因素和多因素COX风险比例模型分析表明,年龄,N分期和14-lncRNA风险特征与原发人群GC的OS显著相关。然后,作者使用多元COX风险比例模型分析来构建结合这三个因素的列线图,以预测3年和5年OS,如下图所示:
校准曲线表明,在所有三个队列中,列线图在预测和实际操作系统之间具有较高的一致性,如下图B所示。在训练队列中,一年,三年和五年OS的列线图的AUC-ROC分析分别为0.660、0.731和0.692。内部验证队列中1年,3年和5年OS的列线图的AUC-ROC为0.651、0.772和0.772。在外部队列中,一年,三年和五年OS的列线图AUC-ROC分别为0.734、0.795和0.786,如下图C所示。在训练队列中,列线图的C指数为0.698,在内部验证队列中为0.706,在外部验证队列中为0.726,如下图D所示。
5.基因集富集分析
根据NOM p值<0.05的标准,高风险组中的5条KEGG信号通路发生了显著改变,如下图所示。然而,根据先前发表的研究,作为改变最大的通路之一,KEGG_REGULATION_OF_AUTOPHAGY可能与GC的肿瘤发生和发展密切相关。因此,我们只研究了自噬通路的表达。通过检索PubMed数据库,我们发现ADAMTS9-AS2是这四种lncRNA中研究最多的lncRNA,并且与大多数癌症有关。因此,我们只研究了ADAMTS9-AS2表达与自噬途径中枢基因之间的关联。使用TCGA-STAD数据进行的分析表明,ADAMTS9-AS2与在自噬调节中起作用的多个hub基因密切相关,包括ATG2A,ATG3,ATG4A,ATG4B,ATG4D,IFNG,ULK3和PIK3R4。
6.验证GC样品中lncRNA的表达
使用qRT-PCR在来自10位患者的10个配对肿瘤和癌旁组织中研究了一部分特征的几种lncRNA(LINC01210,C15orf54,ADAMTS9-AS2和ERICH3-AS1)的表达。结果表明,与癌旁样本相比,LINC01210,C15orf54和ERICH3-AS1在肿瘤中显著上调,如下图A-C所示。相反,与癌旁样品相比,ADAMTS9-AS2在肿瘤中显著下调,如下图D所示。这些结果与TCGA STAD数据集的结果一致。
作者成功地构建了与TCGA和外部队列中GC预后相关的14-lncRNA风险特征。结果表明,14-lncRNA风险特征是GC患者的有效预测指标。此外,作者确定并验证了可靠的列线图,该图结合了14-lncRNA风险特征和临床因素来预测GC患者的3年和5年OS发生率,这可能有助于将来在临床中进行决策。