凝血相关基因构建预后模型巧发13分+BIB~

2022-12-04 17:28:50 浏览数 (2)

导语

凝血级联反应在肝癌的肿瘤免疫微环境(TME)中起着重要作用。

背景介绍

大家看惯了五六分的肿瘤预后分型套路?今天小编为大家带来一篇发表在Briefings in bioinformatics这样的生物信息学期刊的肿瘤预后模型文章,题目为Immune infiltration and clinical significance analyses of the coagulation-related genes in hepatocellular carcinoma,影响因子13.9分。

数据介绍

从KEGG数据库收集凝血途径,包括hsa04610(补体和凝血级联)和hsa04611(血小板活化),共300个基因作为凝血相关基因。

从GEO,TCGA和ICGC收集肝细胞癌的基因表达谱和相应的临床数据集。

分析流程

结果解析

01

凝血相关基因在肝癌中的基因组改变

作者可视化了TCGA队列中355名肝细胞癌患者的拷贝数变异和突变频率。凝血相关基因的DNA突变发生在约65.9%的患者中,总体DNA突变水平在2%至5%之间(图1A-B)。突变频率最高的凝血基因为ITPR3(5%),PIK3CA(5%),ADCY2(5%),C3(5%)和ITPR1(5%)。虽然没有在凝血基因中观察到高突变频率,但体细胞拷贝数变异占大多数DNA改变。大约66.57%的肝癌患者至少有一个凝血基因的体细胞拷贝数变异(图1F)。

图1

大多数具有高CNA突变频率的凝血基因倾向于共扩增而不是共缺失(图1G)。CNA患者具有较高比例的多个肿瘤抑制基因,例如TP53,PKHD1L1和CTNNB1(图1C)。此外,Kaplan-Meier生存曲线显示,低CNA频率患者的生存比CNA频率高的患者更长(图1D、F),但高突变组和低突变组之间的预后没有统计学差异。

总之,体细胞拷贝数变异是肝癌中凝血基因失调的主要原因,并可能导致预后不良。

02

使用凝血基因鉴定肝癌亚型

根据TCGA中凝血基因的表达水平,使用无监督聚类方法确定了两种不同的调节模式,其中200例患者属于凝血cluster1中,109例患者属于cluster2(图2A)。根据PCA分析的结果,所有患者都可以大致分为两部分,这进一步证实了两种截然不同的亚型(图2B)。

作者使用TCGA,ICGC和GSE14103队列评估两个cluster之间患者生存的差异。在所有三个数据集中,cluster1 的生存优势均高于cluster 2(P≤0.05)(图2C)。

图2

然后,作者探索了两个cluster与各种临床特征之间的关系(图2D)。与第2组相比,第1组患者的组织学G1、儿童1级、TNM I-II期和活体结局的比例更高,存在显著差异(图2E)。这些结果表明,凝血基因可能通过一些潜在的机制影响肿瘤的发展。

03

不同亚型的免疫景观

作者进行了GSVA分析来确定TCGA队列中两个cluster之间途径富集分析的差异,发现两种亚型显示出不同的免疫浸润模式。cluster1的免疫和炎症通路和肝癌干细胞信号调节通路显著富集(图3)。GSEA分析结果表明,在cluster1中高度表达的差异表达基因在T细胞受体信号通路、B细胞受体信号通路、Th1和Th2细胞分化以及Th17细胞分化中显著富集(图3B)。

图3

考虑到凝血亚型与免疫活性之间的密切关系,作者通过使用ImmuneCellAI在线工具研究了两个cluster的肿瘤免疫微环境(图3C)。cluster1亚型的特征在于B细胞、CD8 幼稚细胞、CD4 幼型、CD4 T、CD8 T、自然杀伤性T细胞、Th1、滤泡辅助T细胞和中心记忆T细胞的高浸润性,而cluster2的特征是树突状细胞、诱导调节性T细胞、天然调节性T细胞,Th17,单核细胞和中性粒细胞的高度浸润。

作者进一步计算了恶性肿瘤组织中的基质评分,免疫评分和估计评分。如图3D所示,与cluster2的样本相比,cluster1中的样本也表现出显着更高的估计分数,基质评分和免疫评分。另外,主要组织相容性复合物和T细胞刺激子的表达水平在cluster1中往往较高(图3E和F)。

图4

随后,作者研究了凝血亚型是否与免疫治疗效果有显著相关性,包括TMB评分、TIDE评分和免疫检查点分子表达(对免疫检查点抑制剂的反应)。与cluster2亚组相比,cluster1中PD-1、PD-L1、CTLA4、HAVCR2、LAG3和TIGIT的表达水平分布显著较高,TMB评分也显著高于cluster2。TRED得分在cluster1中高于2组(图4A-C)。

最后,作者计算了肝癌常见化疗药物的IC50,以评估两种凝血亚型的药物敏感性。cluster1中索拉非尼,阿霉素,长春花碱,索拉非尼和顺铂的IC50值高于聚乙二醇。综上,cluster1对免疫治疗的反应较好,对化疗药物有较好的影响。

04

识别hub基因

作者使用STRING数据库构建了200个节点和6742条边组成的凝血基因PPI网络(图5A)。采用度数和最大邻域分量(MNC)两种拓扑算法,从PPI网络中鉴定hub基因。结果鉴定了20个凝血基因为凝血途径的hub基因。

作者进一步使用GSE19151数据集(深静脉血栓形成样本和正常样本)筛选关键的凝血基因。使用limma算法识别VTE和正常样品之间740个差异表达基因(图5C)。有三个关键的基因(PRKACA、PIK3R1 和 ITGB2)是GSE19151和前文鉴定的20个基因重叠的(图5D)。

通过GSCA在线工具,在14种癌症类型中评估了凝血hub基因的表达模式。PRKACA和ITGB2在大多数肿瘤样本中上调,PIK3R1在LICH,THCA和KIRP中主要上调。泛癌生存分析表明,hub基因在多种癌症中起保护作用(图5F)。

图5

作者使用两个肝细胞癌队列(ICGC和GSE14520)和两个VTE队列(GSE19151和GSE48000)作为验证集,探究了这三个凝血hub基因的表达水平。在两个HCC数据集中,癌症样本中只有PIK3R1上调,而ITGB2和PRKACA表达在癌症组和正常组之间没有统计学差异。PIK3R1也是两个VTE队列中唯一一个差异表达的hub基因。因此,接下来主要探究PIK3R1异常表达背后的机制。

PIK3R1的CNA频率高于其他两个基因,CNA删除占所有类型中的大多数(图6C)。甲基化分析显示,肿瘤组ITGB2和PIK3R1的β值高于正常组,PRKACA则完全相反(图6D)。综上,SCNA和甲基化可能是肝癌中PIK3R1上调的重要原因。

图6

为了研究hub基因的预后价值,作者基于TCGA数据进行了单变量Cox回归。只有PIK3R1可以作为肝癌的保护因子(HR=0.844,P=0.04)(图6E)。对PIK3R1进行KM生存曲线分析,发现PIK3R1与肝癌患者的总体生存显著相关(图6F)。多变量Cox回归显示PIK3R1被鉴定为独立的预后因子。综上,凝血途径hub基因PIK3R1可能是恶性肿瘤患者的保护因子。

05

凝血基因构建肝癌预后模型

使用TCGA队列中具有生存信息的368名肝癌患者构建预后模型。利用LASSO Cox回归分析从300个凝血基因中筛选出最佳预后特征。结果选择11个凝血相关特征构建凝血相关风险评分(CRRS)模型(图7A和B)。CRRS模型的计算公式如下:凝血相关风险评分(CRRS)=(0.188*SERPINA1) (−0.153*CFHR3) (0.571*PPP1CB) (−0.831*P2RX1) (0.422*PLCB3) (−0.359*PLCB4) (0.537*PIK3R6) (−0.262*GP6) (-1.170*PIK3R1) (−0.257*GP1BA) (−0.598*PLA2G4F)。

高评分组患者生存比低评分组更差(图7E)。采用Cox回归模型的C指数和ROC曲线来评价模型的预测能力。与单因素cox回归模型相比,组合模型的C指数最高(图7F)。在三个不同的数据集(TCGA、ICGC 和 GSE14520)中,与其他单因素相比,组合模型ROC曲线的AUC面积最大,这证明了组合模型的最佳预测预测效率(图7G)。综上,只有包含上述11个凝血相关特征的预后特征才能产生准确的预后预测。

图7

06

基于风险模型的肝癌治疗策略

作者比较了凝血风险模型中高风险组和低风险组5个免疫检查点分子(PD1、PD-L1、CTLA4、LAG3和HAVCR2)的表达。结果表明,三种免疫检查点分子(PD-L1,CTLA4和LAG3)在高风险组中显著上调(图8A)。

为了评估凝血风险评分作为预测免疫检查点阻滞剂治疗临床反应的生物标志物的能力,作者比较了不同风险组中TMB,TME评分和TIDE评分的分布。结果显示,高风险组的TMB和TME评分较高,而TIDE评分则相反(图8C,D和E)。由于凝血亚型与免疫微环境根据上述研究具有显著相关性,作者进一步研究了凝血模型是否能预测肝细胞癌的免疫治疗反应。

图8

06

风险模型作为肝癌独立预后因素

作者通过单变量和多变量Cox回归分析来确定凝血风险模型是否是肝癌的临床独立预后因素。凝血模型,年龄,性别,癌症类型和TMM分期等作为协变量进行分析。结果表明,年龄,分期和风险模型是可用于预测肝癌患者预后的独立因素(图9A和B)。

通过结合独立的预后因素构建了一个列线图,预测肝癌患者的死亡率(图9C)。通过为每个预后参数添加点数,将为每位患者分配一个总分值。总分越高,患者预后越差。此外,多个队列(TCGA、ICGC 和 GSE76427)的校准图表明,列线图的性能与理想模型相似(图9E)。基于TCGA队列的不同变量的时间依赖性C指数曲线显示了与其他单一因素相比,列线图的最佳性能(图9D)。三个队列的时间依赖性ROC也显示,列线图具有高预测能力(图9F)。

图9

小编总结

本文使用凝血途径相关基因构建了肝癌患者的预后模型,工作非常全面,值得学习。

首先,在KEGG数据库中检索了血小板和凝血关键词,在hsa04610(补体和凝血级联)和hsa04610(血小板活化)中收集凝血相关基因。第二,发现肝癌队列中凝血基因的拷贝数变异频率很高,存在拷贝数变异的患者预后较差。第三,根据凝血基因表达将患者分为两种亚型,两种亚型之间的预后存在显著差异。cluster2的生存时间比1长。使用GSVA和GSEA分析探索这些差异的原因。第四,作者研究了两种凝血亚型与肿瘤免疫细胞浸润之间的关系。cluster1 与免疫抑制相关,并导致肝细胞癌预后较差。cluster2与免疫激活显著相关,并导致更好的肝癌预后。第五,从PPI网络中鉴定出三个关键hub基因(ITGB2,PIK3R1和PRKACA)。其中,PIK3R1是唯一一个在VTE亚型中上调在肝癌亚型中下调的关键基因。第六,考虑到凝血基因和凝血亚型对临床结局的影响,基于LASSO Cox回归分析确定了11个预后特征构建了凝血相关风险评分。在TCGA队列中,模型显示出与患者总体生存的关联,并且低风险组与良好预后显著相关。单因素和多因素Cox回归分析表明,凝血模型是一个独立的预后因素。

na

0 人点赞