DeepMind发布蛋白质AI设计系统AlphaProteo

2024-09-12 17:08:48 浏览数 (1)

2024年9月5日,DeepMind发布AlphaProteo,这是其首个用于设计新型高强度蛋白质结合物的人工智能系统,可作为生物和健康研究的基石。

人体内的每一个生物过程,从细胞生长到免疫反应,都依赖于蛋白质的分子之间的相互作用。就像钥匙开锁一样,一种蛋白质可以与另一种蛋白质结合,帮助调节关键的细胞过程。像AlphaFold这样的蛋白质结构预测工具已经让我们对蛋白质如何相互作用以发挥其功能有了深入的了解,但这些工具无法创造出新的蛋白质来直接操纵这些相互作用。

不过,科学家们可以创造出成功与目标分子结合的新型蛋白质。这些结合物可以帮助研究人员加快广泛的研究进展,包括药物开发、细胞和组织成像、疾病理解和诊断,甚至作物对害虫的抗性。虽然最近的蛋白质设计机器学习方法取得了长足进步,但这一过程仍然十分费力,需要大量的实验测试。

AlphaProteo可以为多种目标蛋白生成新的蛋白结合物,包括与癌症和糖尿病并发症有关的血管内皮生长因子-A。这是人工智能工具首次成功设计出血管内皮生长因子-A的蛋白质结合物。

图1 AlphaProteo的概述和实验性能

在测试的七种目标蛋白质上,AlphaProteo还实现了更高的实验成功率,其结合亲和力是现有最佳方法的3到300倍。

了解蛋白质相互结合的复杂方式

能与目标蛋白质紧密结合的结合物很难设计。传统方法耗时长,需要多轮大量的实验室工作。结合物设计完成后,还要经过多轮实验来优化结合亲和力,使其结合得足够紧密,以便发挥作用。

AlphaProteo以蛋白质数据库(PDB)中的大量蛋白质数据和AlphaFold中的1亿多个预测结构为基础进行训练,掌握了无数分子相互结合的方式。给定目标分子的结构和该分子上的一组首选结合位置,AlphaProteo就会生成能在这些位置与目标分子结合的候选蛋白质。

与目标蛋白相互作用的预测蛋白结合结构的图示。蓝色显示的是由AlphaProteo生成的预测蛋白质结合结构,旨在与目标蛋白结合。黄色显示的是目标蛋白,特别是SARS-CoV-2穗状受体结合结构域

在重要蛋白质结合目标上取得成功

为了测试AlphaProteo,开发人员为不同的目标蛋白设计了结合物,包括两种参与感染的病毒蛋白BHRF1和SARS-CoV-2穗状蛋白受体结合域SC2RBD,以及五种参与癌症、炎症和自身免疫性疾病的蛋白IL-7Rɑ、PD-L1、TrkA、IL-17A和VEGF-A。

AlphaProteo的系统具有高度竞争性的结合成功率和同类最佳的结合强度。对于七个靶点,AlphaProteo在实验室中生成的候选蛋白在实验测试中与目标蛋白结合力很强。

图2 AlphaProteo成功生成结合物的七种目标蛋白的预测结构示意图。蓝色显示的是在湿实验室中测试的结合物示例,黄色显示的是蛋白质靶标,深黄色突出显示的是预期的结合区域。

对于病毒蛋白BHRF1这一特定靶标,在谷歌DeepMind湿实验室进行测试时,88%的候选分子都成功结合。根据测试的目标,AlphaProteo结合物的结合强度平均比现有最佳设计方法高出10倍。

对于另一个靶点TrkA,设计出来的结合物甚至强于之前针对该靶点设计的、经过多轮实验优化的最佳结合物。

图3 显示了与其他设计方法相比,AlphaProteo对七种目标蛋白中每一种的体外实验成功率。更高的成功率意味着需要测试的设计更少,才能找到成功的结合物。

图4 条形图显示了AlphaProteo在未进行实验优化的情况下,与其他设计方法相比,对七种目标蛋白的最佳亲和力。亲和力越低,说明结合蛋白与目标蛋白结合得越紧密。请注意纵轴的对数刻度。

验证成果

除了在湿实验室进行计算验证和测试AlphaProteo外,DeepMind还邀请弗朗西斯-克里克研究所(Francis Crick Institute)的Peter Cherepanov、Katie Bentley和David LV Bauer研究小组对蛋白质结合物进行验证。研究小组证实,这些结合物的结合相互作用确实与AlphaProteo预测的相似。此外,研究小组还证实这些结合物具有有用的生物功能。例如,一些SC2RBD结合物被证明可以防止SARS-CoV-2及其一些变种感染细胞。

AlphaProteo的性能表明,它可以大大缩短涉及广泛应用的蛋白质结合物的初始实验所需的时间。不过,AlphaProteo的人工智能系统也有局限性,因为它无法成功设计出针对第8个目标--TNFɑ的粘合剂,TNFɑ是一种与类风湿性关节炎等自身免疫性疾病相关的蛋白质。研究人员选择TNFɑ来挑战AlphaProteo,因为计算分析表明,要设计出针对TNFɑ的结合物极其困难。AlphaProteo的团队将继续改进和扩展它的功能,以期最终解决此类挑战性目标。

实现强结合通常只是设计可能用于实际应用的蛋白质的第一步,在研发过程中还有许多生物工程障碍需要克服。

以负责任的态度发展蛋白质设计

蛋白质设计是一项快速发展的技术,它蕴含着巨大的科学潜力,能够助力我们深入了解致病机制、加速病毒诊断测试的开发、推动更可持续的生产工艺,并探索环境污染物清除的新途径。

为了应对生物安全方面的潜在风险,在长期坚持的责任与安全方针的基础上,DeepMind正在与顶尖的外部专家合作,分阶段分享DeepMind的工作方法,并为社区开发最佳实践提供指导。

展望未来,DeepMind将与科学界合作,利用AlphaProteo解决有影响的生物学问题,并不断探索其应用的边界和潜在限制。DeepMind还在Isomorphic实验室探索其药物设计应用,并对未来的发展充满期待。

与此同时,DeepMind还致力于提升AlphaProteo算法的成功率和亲和力,以应对更广泛的设计挑战,并与机器学习、结构生物学、生物化学等多领域研究人员紧密合作,共同为社区开发负责任且全面的蛋白质设计产品。

参考资料:

https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/

0 人点赞