大家好,今天菠萝冰给大家分享一篇22 分的学习笔记。
题目:病毒驱动型和致癌物驱动突变型头颈癌的免疫状况。
参考文献:https://doi.org/10.1016/j.immuni.2019.11.014
一、 分析思路
我们给⼤家简单解读⼀下分析思路:本篇学习笔记中通过单细胞RNA测序分析和多光谱免疫荧光(IF)比较了突变驱动型和病毒驱动型(HPV )头颈部鳞状细胞癌HNSCC的免疫状况,并研究了肿瘤中的空间定位模式和微环境(TME)中细胞邻近关系。为HPV 和HPV-HNSCC中的免疫谱系,细胞的转录状态和分化轨迹以及与肿瘤进展潜在相关的细胞交互提供了深入了解。最后,还确定了在临床中具有预后潜力的基因集。
二、 结果解读
1.HNSCC免疫谱系的单细胞研究
首先,测序完成得到基因/barcode矩阵后,经过质量控制,一共评估了HPV–和HPV HNSCC患者以及健康供体的外周和肿瘤内免疫细胞中131,224个单细胞的转录谱。
实验组:术后未接受免疫治疗的HPV–患者(n=18)、HPV HNSCC患者(n=8)的原发肿瘤中成对血液和组织来源的所有活细胞(即CD45 PBMC、CD45 TIL)(图1A);对照组:健康供体的外周血单核细胞(n=6)、健康供体的扁桃体组织(tonsil,n=5)。
接着,根据单细胞数据进行伪bulk分析(Pseudobulk analysis),即通过计算细胞的基因总计数,生成每个样本的伪表达谱,以形成每个患者的表达矩阵。鉴定出PBMC,TIL和tonsil之间的差异表达基因后,使用R包heatmap3可视化得到样本间相关性,结果发现相较正常和肿瘤PBMC,组织层面的TIL和tonsil的差异更大,所以接下来聚焦于比较TIL和tonsil。鉴定出TIL和tonsil之间差异表达基因后,还进行了事后功效分析(post hoc power analysis)评估现有研究的统计能力,发现需要9名患者才能有80%的能力找到两者的差异表达的基因。
在进行文库大小归一化,控制线粒体和核糖体基因,对高度变异基因进行scale和主成分分析后,使用了两种方法降维。第一种是FItSNE,主要用于区分亚群;第二种方法是扩散映射,主要用于进行伪时间分析。接下来,使用DRAGON算法进行聚类。图1C为DRAGON确定的26个亚群FItSNE可视化结果。
FItSNE(https://github.com/KlugerLab/FIt-SNE):大大加快了计算时间,但其旨在检测离散的亚群,因此通常无法保留分化数据的连续轨迹。 扩散映射(Diffusion map embedding):能更好地保留全局结构和伪时间序列。 DRAGON:(https://github.com/arc85/dragonsc):结合了高斯混合模型和确定性退火聚类。不同于K均值聚类需要找类中心,高斯混合模型利用的是均值和标准差变化计算各变量的联系;确定性退火则是把细胞聚类最优化问题看作系统自由能最小化问题。
接下来采取的细胞注释策略是先分大类→再分小类。因为在高的温度下,想得到自由能最小,cluster之间的差别要很大,所以他先在较高的T值聚类出四类亚群:CD4 T,B,细胞毒性细胞(CD8 T和NK)和髓系细胞。然后根据已有的基因表达模式来细分细胞类型(图1D),并通过流式细胞术验证。还进行了第二次事后功效分析,验证细胞聚类的可靠性。图1E显示了不同样本来源的细胞情况。
为了量化HPV–和HPV TILs主要免疫谱系的差异,使用巴氏距离(Bhattacharyya)(图1F)衡量了它们之间的差异。结果显示HPV–和HPV TIL之间的B细胞,髓样细胞和CD4 Tconv细胞之间存在较大差异。相反,CD8 T细胞和CD4 Treg细胞较相似。
图1. 评估患者之间转录特征的总体变化以及总体聚集和单细胞鉴定
2.CD8 T细胞具有连续分化轨迹
接下来对CD8 T细胞进行了生物信息学分离并重新聚类,得到了8个亚群(图2A)。TIL的CD8 T最常见于#1-4,而PBMC和tonsil的CD8 T细胞常见于#5-8(图2B)。图2C为每个亚群的差异基因。
图2C得:#1与细胞周期细胞(eg. MKI67)相关;#2与干扰素应答基因(eg. ISG15)相关;#3和4与检查点标记(eg. PDCD1,CTLA4和HAVCR2)相关;#5表达较为静止;#6与幼稚或记忆细胞(eg. CCR7和CD27)有关;#7与早期激活相关(eg. JUNB和FOSB);#8表达与效应功能有关(例如,KLRG1和GZMH)。
接下来,使用自主开发的新R包SingleSeqGset(https://github.com/arc85/singleseqgset)中进行竞争性基因集富集测试(competitive gene set enrichment test),评估了亚群的生物学功能。其中,#4缺氧反应有富集,而先前已经证实缺氧诱导因子可增强CD8 T细胞效应,这表明该亚群抗肿瘤活性更高。
接下来,使用R包Destiny进行扩散映射分析(diffusion map analysis)来推断分化轨迹。结果显示出一条无分叉平滑轨迹(图2E),HPV 和HPV- TIL也有重叠(图2F)。因为DC1与抑制性受体表达以及腺苷代谢增强有关,所以认为DC1与终末分化表型密切相关 。总的来说,这个部分鉴定出CD8 T各亚群功能,并根据HPV 和HPV-之间共有的分化轨迹,推断针对CD8 T细胞的免疫治疗策略可能均适用于两种HNSCC。
图2.CD8 T的HPV–和HPV TIL分化轨迹以及抑制性受体的共表达
3.CD4 Tconv的异质性和分化轨迹
接下来比较了HPV–和HPV HNSCC之间CD4 T细胞的转录情况,分别分析了CD4 Tconv细胞和CD4 Treg细胞。CD4 Tconv细胞聚类出7个不同的亚群(图3AB),#1和6大部分由HPV TIL和tonsil组成,HPV– TILs则分布在#4和7之间。基因富集发现tonsil和TIL中的CD4 Tconv细胞显示出T滤泡辅助功能(TFH)和1型辅助功能(TH1)的富集,且HPV 与HPV– TIL相比,具有显著的细胞富集,说明HPV T细胞的效应功能更强。
图3C为CD4 Tconv细胞的分化轨迹,不同于CD8 T细胞,扩散图的前3维产生了分支轨迹(图3C),且发现HPV–和HPV TIL的分化平面显著不同(图4D)。接下来将扩散拟时间(pseudotime,DPT)作为第三维与DC1,DC2一起分析,DC1和DC2都与DPT正相关。与基因集富集分析一致,#2是最幼稚的亚群,然后通过连续的中间表型,向#1或#7终态发展。图3E显示了#1和7的差异基因表达,#1与TFH有关,#7与记忆性功能有关。CXCR5和PDCD1与DC1的表达有关,还发现了其他已知抑制性受体(LAG3和HAVCR2)在CXCR5和PDCD1共表达时明显表达。这表明了早期阶段的命运决定模式,过程中细胞可以发展为CD4 TFH或者通过抑制受体共表达,从而潜在地抑制进一步分化。
图3.A-E CD4 Tconv的转录状态和分化轨迹的分析
4.CD4 Treg细胞中与IFN和TNFR相关的信号
CD4 Treg细胞能抑制抗肿瘤免疫反应,其细胞聚类发现了6个亚群(图3FG),主要由TIL细胞构成。接下来,进行了基因集富集分析,以表征每个亚群的生物活动(图3H)。#2和4与IFNα应答相关,#3和6与TNFR家族信号通路相关,表明这些细胞根据其分化状态对不同的信号作出反应。
CD4 Treg细胞的扩散映射图显示DPT与DC1密切相关(图3I)。沿着DC1轴,HPV–与HPV TIL Treg细胞的密度存在细微差异,在早期DPT处,来自HPV– TIL的Treg细胞更多(图3J)。
然后还发现TNFR与DC1正相关,并在晚期DPT表达。相反,IFN反应基因IFITM1,IFIT1,IFIT3和ISG20在早期DPT时表达,并随着伪时间的进展而静止,表明IFN信号在Treg细胞的早期活化中具有潜在作用。综上所述,该分析表明,Treg细胞在HPV–和HPV HNSCC之间具有相似的轨迹,并且在分化过程中IFN相关信号和TNFR家族信号相关,提示靶向Treg细胞的早期激活过程可以使用基于IFN的治疗,而晚期激活的Treg细胞可能对TNFR介导的信号传导更敏感。
图3.F-J CD4 Treg细胞的转录状态和分化轨迹的分析
5.在HPV TIL中发现了生发中心B细胞
已经发现TME中的B细胞与人类肿瘤类型的总体生存呈正相关,并会影响CD4 Tconv细胞表型。B细胞聚类显示11个亚群(图4A),基因集富集分析确定了:生发中心B细胞(#1-4)、浆细胞(#5)、幼稚细胞(#6和9),记忆细胞(#8和11)(图4C)。细胞周期富集提示#3和4为暗区中迅速增殖的B细胞,而#1和2为亮区的中心细胞,在此处它们会受到CD4 TFH的选择。而在HPV–TIL中,仅存在于血浆或早期的B细胞(图4B)可能与缺乏CD4 TFH有关(图3BE)。B细胞的扩散映射图(图4DE)显示了跨多轴分化的复杂过程,可以看到DC1与生发中心形成有关,DC4与从幼稚到记忆B细胞的过渡有关以及DC3与向浆细胞的发育相关,其中HPV–TIL和HPV TIL在DC1上有显著的差异,提示生发中心B细胞的显著差异。生发中心B细胞存在于HPV HNSCC各个发展阶段,而HPV–HNSCC中心B细胞较少,提示HPV HNSCC可能有更好的预后。
图4. B细胞分析揭示了生发中心B细胞和相关的独特B细胞群体
6.共同的轨迹产生不同的髓系状态谱
髓样细胞有肿瘤相关巨噬细胞(TAMs)和树突状细胞。TAM可以抗肿瘤的M1样或促肿瘤的M2样。最近研究表明TME中髓样细胞之间存在更广泛的异质性,或可共同表达或独特表达。这里确定了8个髓样细胞亚群,其中#2-4主要存在于PBMC中,而#1和#5-8主要存在于TIL中(图5AB)。
#2为CD16 单核细胞,#3和4为CD14 单核细胞(CD16 更成熟),且#3的FCGR3A(CD16)表达较低,表明它不是CD14 CD16 单核细胞的过渡亚群。#5和7则表达高水平的趋化因子和细胞因子。#1、6和8表达较高的HLA分子(与抗原呈递细胞一致),但#1的IDO1,CCL17和CCR7表达较高;#6表达CD1C(与常规树突状细胞一致);#8高表达补体相关基因,以及M2相关基因。在HPV–TILs中发现有更多的#1和8,提示HPV–疾病患者具有潜在的免疫抑制作用。
接着进行扩散图映射,并确定了几个分支(图5DE),#5位于中心,在DC1和DC2轴上的正方向上,#5朝#7和8发展,提示#7和8为终末分支(图5EG)。已知补体高表达与未成熟的树突状细胞相关,表明促进#8这个树突状细胞亚群的成熟可以改善抗肿瘤T细胞反应。(图5G)
图5. 髓系细胞在TME中的独特状态和潜在的可塑性
7.免疫细胞之间的crosstalk
单细胞转录组学分析不仅可以揭示细胞内在信息,还可以通过配体和受体表达来探究可能的细胞外相互作用。为了找到潜在的细胞间相互作用,使用了708种配体和691种受体的list来鉴定配体/受体的表达,这些配体/受体可以形成总共2557个潜在的相互作用对。首先评估了HPV–和HPV HNSCC中差异表达的配体和受体(图6AB)。接下来,为了挖掘更大的潜在配体和受体作用,使用自主开发的R包CellTalker(https://github.com/arc85/celltalker)鉴定免疫谱系内部和谱系之间的相互作用。总共鉴定了168个配体和194个受体,它们参与了481个独特的相互作用,最后用circos图进行可视化(图6C-6F)。交互大致分为三种类型:common、unique(与健康供体相比)、unique(与所有其他样本相比)。可以看到,与健康人的PBMC和tonsil相比,TIL中的细胞通讯更多。
图6.HPV–和HPV TIL之间的受体和配体表达模式不同,并且在TIL中发生广泛的细胞间通讯
8.空间组织与转录特征一致
尽管上一部分的分析从全局的角度揭示了细胞交互,但了解免疫细胞的空间定位将为基于邻近性推测的细胞间通讯提供更严格的论证。所以接下来对同一患者的成对组织切片进行了多光谱免疫荧光(IF)来探索免疫和肿瘤细胞的空间位置,并基于邻近性确定了可能参与细胞间通讯的免疫亚群。
首先根据每种免疫细胞在亚群的频率对每个感兴趣区域(ROI)进行分层聚类(图7A),揭示了与特定免疫谱系相关的聚类。每张图像中,使用R包trimesh进行了Delunay三角剖分(Delunay triangulation,一种图像处理技术),基于邻近度来识别最可能彼此交互细胞类型。图7B-7F右图为一种细胞类型与另一种类型相互作用的对数比几率。在B细胞频率最高的#3和5中,B细胞相互作用几率最高的是其他B细胞,其次是CD4 Tconv(图7D和7F)。基于空间关系,接下来使用CellTalker来推断HPV–和HPV TIL中B细胞和CD4 Tconv细胞之间交互网络的差异(图7G和7H)。与scRNA-seq和IF分析一致,发现HPV–和HPV TILs中均有B细胞和CD4 Tconv细胞的相互作用,但只有HPV TIL的生发中心B细胞(cluster B-1至cluster B-4)与TFH(clusterCD4 -1)之间有相互作用。
接下来,利用来自TCGA的临床数据和bulk mRNA数据确定HNSCC中的CD4 TFH是否与生存相关。与之前发表的数据,HPV 患者的预后比HPV -好。然后,根据来自scRNA-seq数据中与TFH相关的差异表达基因评估了患者的TFH基因signature,并根据TFH评分进行分层以进行单变量PFS分析(图7I)以及多变量生存分析,高TFH均与较好的预后显著相关。总的来说,确定了不同组织切片的独特免疫浸润模式,并使用CellTalker以及HPV 和HPV-HNSCC中的scRNA-seq数据表征了独特的TFH亚群和生发中心的相互作用,并发现TFH富集的转录特征与更好的预后相关。
图7. IF分析提供了基于空间定位的推定细胞间通讯信息
小结
本篇学习笔记利用scRNA测序评估了HPV–和HPV HNSCC患者以及健康供体的外周和肿瘤内免疫群体中131,224个单细胞的转录谱,转录组结果通过多光谱免疫荧光分析和基于空间邻近性来推测细胞交互来进行背景分析。发现了HPV–和HPV HNSCC免疫谱系之间的差异,这些结果对免疫疗法的设计将产生重要的影响,相似的免疫谱系(CD8 T之间和CD4 Treg之间)靶向疗法可能差异不大,而针对不同的免疫谱系(即CD4 Tconv细胞,B细胞和髓样细胞)的免疫疗法则较为多变。
这篇学习笔记有很多亮点,首先新开发的三种算法:DRAGON:基于热学知识进行聚类、SingleSetGset进行基因集富集测试、CellTalker用于推断细胞交互;其次是研究主题更有转化意义,一般来说很多都是研究不同分子分型之间的差异,而这篇学习笔记着眼于病因差异研究,更容易在临床上进行判断;然后研究内容比较丰富,不仅基于单细胞测序信息分析了特定免疫谱系的亚群状态,还分析了细胞间通讯和细胞邻近性关系。最后是研究中的统计学分析也很严谨,不仅在鉴定差异基因用了事后功效分析,在细胞聚类也用其进行统计学验证。在比较免疫谱系差异时,也较新颖地使用了巴氏距离来量化差异。