arXiv | 预测抗体抗原结合位点的神经消息传递模型

2021-07-05 10:19:19 浏览数 (1)

作者 | 郑仰昆 审稿 | 杨崇周 指导 | 闵小平(厦门大学)

今天带来的是剑桥大学米拉大学的Petar Veličković课题组发表在arxiv.org上的Neural message passing for joint paratope-epitope prediction。

抗体-抗原相互作用中的结合位点分别称为互补位和表位,本文认为互补位和表位的预测器需要不对称处理,因为互补位是高度连续的,可以很好地单独预测,而表位本质上是结构性的,并且固有地受互补位的制约。由此提出了不同的神经信息传递架构Para-EPMP和Epi-EPMP,分别针对互补位和表位特定方面的预测。本文在这两个任务上的都得到了显著的提升效果,并进行了covid-19相关的抗原的定性预测。这样的计算工具将允许快速确定covid-19的突变的影响,从而使疫苗的开发能够跟上快速发生的突变体。

本文将抗体的互补位和相应抗原的表位预测转化为一个二元分类问题:对于抗体和抗原中的每个氨基酸残基,它们分别参与了结合吗?并利用整个可变片段FV区域作为输入,分别设计了互补位预测模型和表位预测模型

模型构造

数据

预处理的数据集取自PECAN。每个氨基酸有62维特征向量。复合物已被过滤以确保在其各自的数据集中没有两种抗体/抗原相似。

图1 Para-EPMP体系结构

互补位模型

对于本文的互补位预测模型,将整个FV区域作为输入,输入特征最初是按顺序处理的序列信息,之后合并图结构。图1概述了这个模型及其超参数。氨基酸特征序列首先通过三个CNNs层,之后结合氨基酸邻接图经过2个MPNN层最后输出预测结果。

图2 Epi-EPMP多任务体系结构

表位模型

表位模型结构图如图2所示,是一个只利用结构信息的模型。使用图卷积网络(GCN)编码器来单独处理抗体和抗原图,并使用抗原氨基酸和抗体氨基酸的全连接二部图的图注意网络来结合两种表征的关系,其中抗原氨基酸都注意到抗体氨基酸上,反之亦然。在图注意网络中利用边退出的方法来使网络学习一个更强大的邻域。这个表位模型可以同时预测抗原和抗体的结合氨基酸。

表1表位预测为基准的模型

结果

多任务不对称预测器的结果如表1所示,明显优于目前其他的先进技术。并且测试了模型对于Covid-19中和抗体(B38)与SARS-CoV-2的RBD(受体结合域S1)之间结合界面的预测能力。事实证明,该模型能够正确定位表位的区域。

总结

在这项工作中,本文详细研究了联合表位-互补位预测任务,确定了两个任务之间固有的不对称,并提出了表位-互补位信息传递的一种混合方法,利用这种不对称性为这两个任务设计有效的预测因子。本文在这两个任务上设置了新的最先进的状态,并说明了对目前重要的抗原的定性上有意义的预测。

参考资料

https://arxiv.org/abs/2106.00757

0 人点赞