Nat. Mach. Intell. | 基于深度学习的T细胞受体和抗原结合特异性预测

2021-10-21 11:14:44 浏览数 (2)

编译 | 余梁 审稿 | 陈梓豪

今天给大家报道的是来自MD Anderson Cancer Center的Alexandre Reuben团队发表在Nature Machine Intelligence上的文章Deep learning-based prediction of the T cell receptor–antigen binding specificity。在本篇文章中,作者构建了一个pMHC-TCR结合预测网络(pMTnet),该模型基于迁移学习,用来预测新生抗原(neoantigens)和T细胞受体(T-cell receptors, TCRs)结合特异性。

1

介绍

新生抗原(neoantigens)是肿瘤细胞表面主要组织相容性复合体(major histocompatibility complex, MHC)蛋白表达的短肽,它由突变基因转录和翻译而来。新生抗原是T细胞的靶标,通过T细胞受体(T-cell receptors, TCRs)发生相互作用。因此,新生抗原是免疫编辑中很重要的角色。但是,不是所有的新生抗原都能引发T细胞反应,人们对TCR与出现在MHC分子(pMHC)上的新生抗原结合特异性所知甚少。因此,建立pMHCs与TCR序列的联系至关重要,它可以改善免疫治疗的设计与实现。

在本文中,作者构建了一个名为pMTnet的迁移学习网络,用于预测I类pMHCs与TCR的结合特异性。作者把pMTnet用于人类肿瘤序列数据并进行了一系列观察。总的来说,pMTnet解决了长期存在的TCR-pMHC配对预测问题,揭示了基因组规模的生物观点,它也可以作为生物标记的基础用于预测免疫反应。

2

结果

TCR-抗原结合特异性。为降低预测任务的难度,作者将此分为3个步骤。首先,作者训练一个LSTM网络(图1c),来获得抗原和MHCs的蛋白序列的嵌入(仅Ⅰ类)。其次,作者利用堆叠的自编码器训练TCR序列嵌入(图1a),再次编码TCR序列。最后,在这些嵌入外创造一个深度神经网络,以将来自TCR、抗原肽序列和MHC等位基因的知识以具有生物学意义的方式结合。(图1e)。作者还通过微调确定TCRs和pMHCs预测模型。作者创建了10倍于正例数量的负例,训练150轮结果如图1f所示。

图1:模型细节

pMTnet预测TCR-pMHC。作者从独立的研究中收集了619对经过实验验证的TCR-pMHC数据对,进行了一系列验证分析。在测试中,删除了训练数据集中出现的数据对。测试集的结果显示AUC可达0.827,AUPR可达0.566,如图2a所示。为了判断pMTnet是真正地学到了结合特征还是记住了样例,作者观察了与训练集TCRs具有不同相似度的TCRs的预测表现,如图2b所示。作者还与其它模型进行了比较。接下来,作者通过结合T细胞的期望影响进行了验证,如图2c所示。作者进一步分析了pMTnet能够区分多肽序列的细节对TCR结合特异性的影响。

图2:pMTnet表现

作者利用前瞻性实验数据进一步验证pMTnet,发现具有更强结合力的TCRs展现出更高的克隆比例(图3a),还观测到更强的富集和更小的优势比(图3b)。通过对比T细胞,作者观察到在T细胞增殖、迁移、存活和细胞毒性的关键途径中富集的差异表达基因(图3c)。作者还计算了最佳TCR克隆型的克隆大小,并发现大多数TCR克隆型展现出更大的克隆比(图3d)。

图3:前瞻性验证

结构分析。作者实施残基对突变,并记录野生TCRs和突变TCRs结合水平的差异。作者将TCR的CDR3分为6个长度相等的片段(图4a),中间片段的残基更有可能诱发亲和力的变化。作者发现接触残基比非接触残基更有可能诱发更大的预测pMHC结合强度变化(图4b)。图4d和4e展示了一个TCR-pMHC的结构实例。

图4:对相互作用的结构分析

人体肿瘤TCR-pMHC交互。作者分析了数据集中最具免疫原性肿瘤类型的TCR和pMHC交互。图5a展示了一个ccRCC患者的总抗原和免疫抗原数。对于所有癌症类型的患者,作者计算了新生抗原、自抗原和HERV-E的免疫性抗原比例,作者观察到新生抗原比自抗原更具免疫性(图5b)。其次,作者检验了TCR-pMHC交互的影响。作者展示了能否结合任意抗原的TCRs平均克隆比例(图5c)。

图5:人类肿瘤中TCR-pMHC相互作用

TCR-新生抗原交互影响肿瘤进展和免疫治疗反应。作者检查了LUAD、LUSC、SKCM和RCC中NIES与病情之间的关系,并推断当有足够的T细胞渗透物时,新生T细胞更有可能激活。有趣的是,在肺癌和黑色素肿瘤患者中,更高的NIES与更高的生存率相关(图6a-c)。多变量分析也被用在存活率与NIES存量当中(图6f)。相似的结果也发生在不同的阈值上(图6g)。

图6:TCR-新生抗原交互反应影响

3

讨论

本文模型仅需给定TCR序列和(新生)抗原序列以及MHC类型即可完成TCR结合特异性预测,并进行了一系列基因组范围的分析。该模型还可用于治病治疗以及设计TCR-T或新生抗原治疗。总体而言,本文证明了TCR和PMHCs之间的配对,仅给予TCR、抗原和MHC序列的情况下是机器可学习的,这为将来产生更高精度TCR抗原预测模型的研究奠定了基础。

参考资料

Lu, T., Zhang, Z., Zhu, J. et al. Deep learning-based prediction of the T cell receptor–antigen binding specificity. Nat Mach Intell (2021).

https://doi.org/10.1038/s42256-021-00383-2

0 人点赞