文信息
题目:Single cell RNA sequencing reveals differentiation related genes with drawing implications in predicting prognosis and immunotherapy response in gliomas 日期:2022-02-03 期刊:scientific reports 链接:https://www.nature.com/articles/s41598-022-05686-x
摘要
胶质瘤是起源于中枢神经系统的最常见的原发性肿瘤,目前没有适用于胶质母细胞瘤 (GBM) 和低级别胶质瘤 (LGG) 的预后模型。胶质瘤是由胶质瘤干细胞 (GSC) 驱动的,这主要是导致目前针对恶性胶质瘤的治疗策略失败的原因。考虑到 GSC 的多能性,它们可以分化成多个细胞亚群,从而导致细胞分化状态的高度异质性。有研究表明,GSCs 的分化状态可能与耐药性有关。但目前细胞分化的机制仍不清楚,因此确定与星形胶质细胞有关的 GSC 中涉及的分化相关基因 (DRG) 可能有助于识别新的生物标志物。本文旨在确定分化相关基因从而预测胶质瘤患者的预后和免疫治疗反应。
基础数据分析
作者选用GEO数据集GSE103224,从中过滤获得了 15,853 个细胞,分群得到23个cluster,第 14 和 18 群为巨噬细胞,第 10 群为单核细胞,第 12、13 和 15 群倾向于与干细胞密切相关,第 19 群倾向于与上皮细胞相关,其余簇倾向于与靠近星形胶质细胞。
之后对 12,456 个星形胶质细胞和干细胞进行了拟时序分析,确定了 3 个具有不同分化模式的细胞分支。提出一个假设:状态 1 的细胞是初始类型的细胞,然后分化成其他状态。
基于 DRG 的胶质瘤患者分类
DRG包含了三种细胞分化状态的总共833个marker基因,再结合TCGA-GBM 数据、GSE4271 和 GSE43378 数据集中这些DRG的表达矩阵,确定了 3 类具有不同总生存期的患者。C3 患者的预后往往最好,而 C2 患者的总生存期较差。PCA结果也可以显著区分各个胶质瘤样本。
F图显示,C3 患者的病理分级往往低于其他患者,与总生存分析结果一致。
G图显示,分化状态 1 的 DRGs 上调/下调在 C2 样本中呈现相似趋势,分化状态 3 上/下调 DRGs 的表达模式在 C3 样本中表现出相似趋势,这意味着 C2 的胶质瘤细胞是主要处于分化状态1,代表较低的分化状态;C3细胞主要处于分化状态3,代表分化程度较高的状态
C2和C3患者差异分析的富集结果表明,与C3相比,C2的胶质瘤主要与免疫反应(例如,T细胞介导的免疫和适应性免疫反应的正调节)和肿瘤发生(例如,ECM 受体相互作用和细胞凋亡)相关。
不同患者具有不同的肿瘤免疫微环境和免疫治疗反应
图A显示C2 中的免疫和基质细胞丰度最高,肿瘤纯度最低;C3 中免疫细胞和基质细胞的丰度最低,肿瘤纯度最高。而具有较低免疫细胞和基质细胞丰度以及较高肿瘤纯度的患者往往具有更好的生存率(图B)。
C3中follicular helper T cells and activated NK cells数量更多,C2中eosinophils and activated dendritic cells 数量更多(图C)。包括PDCD1LG2、HAVCR2、CTLA4、TNFRSF18、 TNFRSF9 、B2M和CD274在内的免疫检查点基因在C2肿瘤中的表达量最高(图D)。CD274表达水平较高的患者预后较差,LAMA3表达水平较高的患者预后较好。
图G所示 ,C2 的抗 PD1 免疫治疗评分显著高于 C3,表明 C2 患者更容易抗 PD1 治疗。与 C2 相比,C1患者更容易抗 CTLA4 免疫治疗。当同时应用抗 PD1 和抗 CTLA4 时,C3 患者产生抵抗反应的可能性低于 C2 或 C1 患者。
基于DRGs的预后模型的构建与验证
WGCNA分析了整合数据的DRGs表达矩阵,筛选出3个模块,其中turquoise模块与胶质瘤患者的生存时间和肿瘤等级显著相关。之后拿出 turquoise 模块中的 163 个基因进行单变量 cox 分析,鉴定了 38 个具有预后价值的 DRG。最后使用LASSO回归算法构建了一个由12个基因组成的预后模型。G图表示,无论是在训练队列还是验证队列中,低风险组患者的总生存期均显著高于高风险组患者。此外,在训练队列中,预测 1 年、2 年和 3 年总生存期的ROC的AUC分别为 0.730、0.747、0.798 和 0.864、0.856、在验证队列中分别为 0.860。
与其他发表的胶质瘤预后模型对比,本文的模型预测 1 年和 2 年总生存期的 AUC 高于其他模型,并且在验证队列中,该模型的准确性也优于其他胶质瘤相关模型。
如下图A、B所示,RAB27A、TMEM176B、S100A10、BRI3、MGP、CYSTM1、RBP1、TOP2A 和 HMGB2的表达水平随着风险评分的增加而增加,表明这些基因作为风险基因,而GSTA4、SCD5和MARCKS充当保护基因。
在训练队列中,单变量 cox 分析结果显示,年龄、等级和风险评分与胶质瘤患者的预后显著相关。多变量cox分析结果表明,年龄、分级和风险评分可以作为预测胶质瘤患者预后的独立因素。当然也在验证队列中获得了类似的结果。
基于训练队列构建了整合年龄、性别、等级和风险组的列线图,用于预测胶质瘤患者在 1、2 和 3 年的生存率。预测 1 年、2 年和 3 年总生存期的 AUC 分别为 0.752、0.799 和 0.861(图 H)。预测 1 年、2 年和 3 年总生存期的校准曲线接近实际观察值。
高风险和低风险人群的免疫治疗反应
模型中 12 个预后基因的表达水平与浸润性免疫细胞丰度之间的相关性如图A。其中,GSTA4、HMGB2、MARCKS和TOP2A的表达水平与活化的浸润性免疫细胞的浸润呈正相关。NK 细胞和 M2 巨噬细胞的浸润呈负相关,表明预后基因的表达模式与 TIME 之间存在潜在的相关性。
D图显示,12个预后基因的表达量在不同的细胞亚群中是不同的。与其他预后基因相比,MARCKS在大多数细胞中广泛表达。BRI3、RBP、SCD5和HMGB2在星形胶质细胞中高度表达。
与其他集群相比,C2 患者的风险评分会更高,C2中大部分患者分布在高危组,C3中大部分患者分布在低危组,这与之前的结果一致。