革命性进展?诺奖级发现?AlphaFold3是重磅创新还是版本升级

2024-05-17 19:55:27 浏览数 (2)

《Nature》杂志日前发表了谷歌DeepMind团队和AI药物研发团队Isomorphic Labs的合作研究,展示了全新的蛋白质预测模型AlphaFold3。新模型不再局限于预测蛋白质或蛋白质-蛋白质复合物的结构,而是能够破解蛋白质与各种生物分子所形成的复合体结构及其相互作用。

重大突破、革命性进展、诺奖级发现……一时间,媒体不吝于用各种“重磅”词汇描述这项成果,有专家认为这将引领结构生物学进入新时代。但也有专家态度淡定,“如果你某天打开电脑,发现Windows做了一次系统升级,会因此而奔走相告吗?”

那么,AlphaFold3究竟是重磅创新还是版本升级?不同声音的背后,是AI作为“科研终极工具”开始触及物理世界本质时,不同人的应对与思考。

核心构架迭代,并非以往技术上的修修补补

当记者拨通复旦大学复杂体系多尺度研究院院长马剑鹏教授的电话时,他刚结束了一场关于AlphaFold3的研讨会,对它的评价脱口而出:“我认为AlphaFold3是诺奖级的成果。”

1972年的诺奖颁奖礼上,诺奖得主克里斯蒂安·安芬森提出一个猜想:蛋白质的氨基酸序列应该能够完全决定这个蛋白的结构。此后很长一段时间,蛋白质结构预测都被认为是“太阳底下最难的科学问题之一”。直到近半个世纪后,DeepMind团队发布了AlphaFold,它能够预测地球上几乎所有蛋白质结构,尽管准确率有待提高。

此前,AlphaFold2被美国《Science》杂志评为2020年十大科学突破之一,但在马剑鹏看来,AlphaFold3的发布不是以往技术上的修修补补,而是理念上大刀阔斧的变革——它直接改变了上一代版本的核心架构,用“扩散模块”取代了上一代中非常重要的“结构模块”,采用了生成扩散模型来预测生物大分子结构。

通过直接预测原子坐标,而非氨基酸特定的框架和扭转角,AlphaFold3的预测对象超越了蛋白质,覆盖到包括核酸、小分子、离子和修饰残基在内的蛋白质复合体,预测准确性超过任何已有工具。

更令马剑鹏在意的是,AlphaFold3已展现某种掌握第一性原理的特质。所谓第一性原理,即我们所处的物理世界的最基本法则,一旦掌握第一性原理,即可从头推导出完整的物理学体系。因此,马剑鹏认为AlphaFold3的应用领域不会仅局限在生物医药,可能还将应用于物理学、材料学等更多领域。

引入扩散模型,带来难以避免的“幻觉”问题

当记者拨通英矽智能计算化学团队科学家刘金鑫的电话时,他们正在研判AlphaFold3对行业的影响。英矽智能是一家由人工智能驱动的生物医药科技公司,在上海张江设有研发中心。

“毫无疑问在计算生物学领域中,这是目前预测蛋白质结构最好的工具,但也不要将其神化。”刘金鑫说,这几天,团队对AlphaFold3做过一些测试,有令人惊喜的地方,也发现了一些问题。

蛋白质三维结构由主链和侧链搭建而成,AlphaFold3在主链的预测上能够提供足够的有效信息,让人们看到主链的走势和蛋白质的整体结构,同时它也有效提高了对侧链预测的精度和速度,但并不能从根本上解决对于侧链的精细摆放问题。

此次DeepMind团队将扩散模型引入AlphaFold,由此带来了难以避免的“幻觉”问题。这将导致模型容易将非结构化的区域输出成看似合理的结构。在蛋白质结构生成中,将会出现两类潜在问题:一方面,针对天然无序蛋白,AlphaFold3可能会生成误导性的结构信息;另一方面,针对由多个无序区链接不同结构域的蛋白,“幻觉”可能会导致不同结构域的相对位置异常。尽管研究者采用了一些技术方法来降低“幻觉”带来的影响,但风险依旧存在。

此外,AlphaFold3宣称可以构建蛋白质与DNA、小分子等复合物的模型,但刘金鑫团队实测发现,在一个有“标准答案”的蛋白质DNA复合物模型中,AlphaFold3给出的预测结果与实验结果存在显著偏差——它成功预测了蛋白质与DNA的结合界面,但没有关联到DNA特定的序列上。

首届世界顶尖科学家协会奖“智能科学或数学奖”得主、加州大学伯克利分校教授迈克尔·I·乔丹此前也提醒过AlphaFold的“幻觉”问题。他认为相较于聊天类的大语言模型,我们更容易被机器“编”的数据欺骗,“你可能根本察觉不出结果是有问题的”。

刘金鑫表示,相对于传统蛋白质折叠预测和动力学模拟等方法,AlphaFold3在大分子药物设计中可显著节省时间和精力,但对更加精细的小分子药物设计,因为对侧链、结合位点的构象要求更加严苛,其效率提升的幅度相对有限。

“超声量掌声”背后,或有更多商业化考量

“没有人指出不足,全是掌声。”英矽智能公司创始人兼首席执行官、加拿大科学家亚历克斯·扎沃洛科夫表示,AlphaFold3并非完美无缺。

事实上,只要认真读一读《Nature》的论文,就会发现DeepMind团队已经坦陈了该模型的诸多不足,比如模型输出有时会违反手性规则,尽管输入是正确手性的参考结构,模型偶尔会产生重叠的原子等。但在媒体对AlphaFold3的新闻报道中,这一切被“隐藏”了。

英矽智能实验室

有专家表示,这或许与AlphaFold3的商业化之路有关。和以往不同,目前AlphaFold3尚未开源,不能在本地部署,研究人员只能通过DeepMind最新推出的研究平台免费访问大部分功能,用于非商业用途,且每天限用10次,但无法获得与潜在药物相关的蛋白质结构。

另一边,AlphaFold3的合作开发者、AI药物研发团队Isomorphic Labs正紧锣密鼓地开展多个药物研发项目。专家预测,在抗体药物方面,AlphaFold3具备极大优势,而在预测类似药物相互作用,包括蛋白质与配体的结合以及抗体与靶蛋白的结合方面,AlphaFold3达到了前所未有的准确性。

“我们正努力复现AlphaFold3。”马剑鹏透露,他的团队也在开发功能与AlphaFold2类似的OPUSFold系统,其在侧链预测精度上比AlphaFold2更高。他表示,从AlphaFold1到Alphafold3,是同一批人深耕的结果,在这个领域要加大投入、久久为功,不要让AlphaFold3的喧闹仅停留在发布会的那一刻。

参考资料:

https://m.whb.cn/commonDetail/931246

--------- End ---------

0 人点赞