2022年8月5日,著名的生物医药行业科学家、评论家Derek Lowe在Chemistry World发表文章Why AlphaFold won’t revolutionise drug discovery,对AlphaFold的最新进展与药物发现的关系进行了评论。
Chemistry World是国际化学领域著名新闻期刊,是英国皇家化学学会(Royal society of chemistry,简称RSC)的会刊。
此前Derek Lowe曾针对AI药物发现发表过许多观点(见本公众号文章Derek Lowe|关于AI药物发现的怀疑与建议)。
图源:Nature Methods. Method of the Year 2021: Protein structure prediction
蛋白质结构预测是一个难点,但更难的问题还在后面。
DeepMind的AlphaFold团队在预测蛋白质结构方面已经取得了相当大的成功。长期以来,这一直被认为是计算生物学中真正困难的问题之一,而AlphaFold在过去一两年中取得了非凡的进展。这在十年前听起来就像是科幻小说的开篇。
这确实令人印象深刻。但是一些头条新闻暴露了对所取得的成就的真正误解。首先,我们并没有在理解蛋白质为什么会这样折叠方面取得突然的巨大飞跃。AlphaFold的研究人员在识别不同的已知蛋白质折叠基序和将它们组装成通常正确的结构方面取得了很大的进展。形成这些coils、loops和sheets是蛋白质通常做的事情,但研究并没有涉及到"为什么"。如果我们在这个层面上等待一个答案,我们还要等待很多年。
我们有成千上万个新的蛋白质结构预测,远远早于我们的预期。而且,尽管有一些例外,它们似乎确实大部分是正确的。AlphaFold的算法在面对无序的蛋白质区域时会不知所措。当你的整个计算技术是建立在寻找已知结构的类推结构上时,当没有结构可以比较,而且永远不会有结构时,你能做什么?一些无序的蛋白质在它们的各种蛋白质伙伴的存在下会突然变成有序的排列,但其他的蛋白质在任何条件下都不会显示出有序的结构。更重要的是,这种特性似乎对它们的功能至关重要!有些蛋白质的行为根本超出了结构的范围,因此也超出了AlphaFold的能力范围。
还需要强调的是(正如上面谨慎的措辞),我们所拥有的是预测而不是真实的蛋白质结构。它们是很好的预测和有用的预测,但获得实际数据(来自X射线、核磁共振或低温电子显微镜)是确定它们有多正确的唯一方法。而且由于构象的灵活性,即使这些数据也不总是最后的结果。这就是为什么关于这个新的预测数据库将如何彻底改变药物发现的新闻报道被夸大了。蛋白质结构在小分子配体的存在下会发生转变和移动,有时是细微的,有时是剧烈的,但AlphaFold(目前)还没有能力预测这些变化。我们很可能最终能够找到解决这些问题的算法,但是到目前为止,还没有足够的小分子配体-结合的蛋白质结构可供借鉴。我们将需要大量的结构。有大约20种不同的蛋白质侧链需要考虑,但小分子结构的数量是如此巨大,以至于相比之下几乎是无限的。
还有一点,在药物发现项目中,对蛋白质结构的了解几乎算不上是限速步骤!这是因为你几乎总是基于使用纯蛋白质或活细胞的分析来运行项目。这些数字应该是为了回答关键问题:这些化合物是否在做我们想要的,随着我们制造新的化合物,它们是否会变得更好?蛋白质的结构可能有助于产生关于下一步要制造什么化合物的想法,但话又说回来,它可能不会。最终,来自真实生物系统的真实数据才是最重要的。随着项目的进行,这些数据包括涵盖药代动力学、代谢和毒理学的检测,而这些都无法从蛋白质结构的层面上真正处理。
最后,药物在临床上失败是因为我们选择了错误的靶点,或者是因为它们做了我们从未预料到的其他事情。蛋白质结构本身并不能减轻这两种风险,但这就是为什么我们在这个行业有85%的临床失败率。蛋白质结构确实是(曾经是)一个非常困难的问题,但这些更难。
Derek Lowe的观点带来了读者的讨论,一些留言供参考。
AMOS FOLARIN:
我倾向于不同意文章的某些部分。拥有良好的结构预测将大大加快获取经验数据集的速度。获得AlphaFold级别的结构是实验工作的一个主要滞后阶段。
MICHAEL BROWN:
在一个结构难以获得的环境中,基于结构的设计将是一个限制因素。在一个有AlphaFold的世界里,情况就不再是这样了。
传统的药物设计是在盲人拄着拐杖的水平上运作;我们会采用先导化合物并添加moieties来影响结合,基本上是沿着结合口袋摸索。有了基于结构的设计,我们现在可以看到。
事实上,它以前不是药物设计的一个重要部分,这与未来如何发现新药没有关系。我非常怀疑这位作者的观点能否成立,基于结构的设计的意义只会越来越大。
LUCA SIGNORILE:
我个人并不同意这种观点。基于结构的药物设计(SBDD)大大有助于降低失败率(如果没有SBDD,它可能会比文章中提到的更高)。当然,AlphaFold的模型仍然是预测,但在没有实验结构的情况下,再加上其他计算方法(如MD模拟),它绝对比我们把化学库倒在细胞/纯化的蛋白质上碰运气要好得多(由于各种原因,现在仍然经常这样做)。
参考资料
https://www.chemistryworld.com/opinion/why-alphafold-wont-revolutionise-drug-discovery/4016051.article
--------- End ---------