Derek Lowe是对AI药物发现提出怀疑、批评 (包括一些针对性的建议) 的制药行业专家之一。
Lowe是一位药物化学家,自1989年以来一直在多家大型制药公司工作,担任过诺华生物医学研究所化学生物学治疗部主任,Vertex、拜耳、先灵葆雅的药物化学实验室负责人、项目负责人和新药发现技术专家。
同时,Lowe发表了大量的博客文章,他的博客In the Pipeline被Science杂志推荐为重点访问的博客之一。
本文整理了Lowe在多篇文章中关于AI药物发现的主要观点。
AI与专利制度
2022年6月8日,结合Nature杂志的文章Artificial intelligence is breaking patent law (5月24日发表),Lowe在Science发表博客文章AI and the Patent System,分析了AI药物发现中的专利问题。主要观点如下。
我还不认为人工智能已经带来了任何新的药物,还没有。但我也认为,鉴于该领域的进展,它没有理由不能,也不应该。现在,人工智能(以及机器学习)并不是你从阅读一些新闻稿中所想象的通往生物制药财富的神奇后门。将这些东西有效地应用于药物发现实际上是相当困难的,而且越来越清楚的是,在许多情况下,我们将不能像我们希望的那样依赖现有的数据。相反,我们可能必须在更干净、更受控制的条件下产生新的数据,给软件一个更健康的输入,一个能产生更可靠结论的输入。这将需要大量的资金和努力。
但这很值得。药物发现和开发的困难是如此严重(而成功的回报是如此巨大),以至于任何能增加其机会的东西都可能具有巨大的价值。
我不认为人工智能会在短时间内提供答案--主要是因为困难在于首先是缺乏知识。你不能指望软件拿着一堆用过的披萨盒,找到一条把它们转换成黄金首饰的路线,不幸的是,我们的很多知识(当你从绝对规模上看)都处于用过的披萨盒的阶段。
也就是说,在我们处理这些大问题之前,我希望人工智能能够帮助我们解决一些(有点)简单的问题,比如 "我接下来应该做什么分子?制造它的最佳方法是什么?这张清单上的哪些分子最有可能成为强效配体"。这些已经够难的了,但它们确实为算法的发展提供了更多的牵引力。
人工智能的专利问题越来越受到关注。如果你确实使用人工智能系统想出了一些有用的、新颖的东西(即可申请专利),你该如何处理发明人的问题?我没有太多的担心,因为我想好了,我们已经在做虚拟筛选和分子建模以及对接,如果有东西被发现,没有人认为这些程序是"发明者",就像没有人认为核磁共振仪或细胞分拣仪(或其软件)是发明者一样。我仍然相信这一点,但我也不得不承认,有一些法律问题是这个观点不能完全解决的。
Nature杂志的这篇评论对这一问题进行了很好的探讨。作者一开始确实提出了一个我认为不切实际的末日想法:如果法院决定人工智能辅助的发明根本不能获得专利,那该怎么办?我认为这不会发生,但文章说得很对,过去对专利制度的挑战是围绕什么是发明展开的,而这次是关于发明人可能是什么。
Nature文章《人工智能正在违反专利法》
专利制度假定发明者是人。机器设计的发明需要自己的知识产权法和国际条约。
我在这里看到的最令人不安的论点是关于"熟练技术 (skilled in the art)"标准的论点。一些重大的知识产权决定都是围绕着这个问题展开的:这个新的申请是否说明它对于本行业的熟练人员来说是显而易见的,因此不能获得专利?这个已经获得专利的发明在这里是否对当时的技术人员来说是显而易见的,因此其专利是无效的?
但问题是:我们之所以把钱投入AI/ML系统,是为了让它们告诉我们一些对我们人类来说不明显的东西。想想当AlphaGo(和AlphaGoZero)开始通过规则寻找有用的策略。
没有人考虑为围棋游戏申请专利,但如果你的人工智能系统产生一个潜在的先导化合物的结构,看起来很奇怪,不太可能,不是你自己做的东西,也不是其他人似乎做的东西,但还是可以用的,那怎么办?在这一点上,"明显 "是什么意思?对人来说很明显?对人工智能系统来说是明显的?
现在就走到这些问题的前面,开始思考这些问题可能是一个好主意。不过,无论好坏,我认为更有可能的结果是,这个问题会在一个又一个的司法管辖区中被讨价还价,出现死胡同和逆转。
AI和药物发现:解决正确的问题
2021年3月19日,结合发表在Drug Discov Today杂志的文章Artificial intelligence in drug discovery: what is realistic, what are illusions? Part 1: Ways to make an impact, and why we are not there yet,Lowe在Science发表博客文章AI and Drug Discovery: Attacking the Right Problems。主要观点如下。
你经常会听到对一种新的计算方法的宣传,即它将如何加快一切:不用再跌跌撞撞地筛选成堆的分子了,不再有乏味的属性优化。但是,虽然这些都很好(请记住,我们还没有到那一步),真正的问题是候选药物在临床上的失败。与临床失败率相比,所有其他的东西都是一个四舍五入的错误。
将临床前阶段的成本降低20%或使其速度提高20%(在某种程度上是同一件事)确实可以为你省钱。但如果你能将临床失败率降低20%,才是“压倒性的”节省。做到这一点的绝对最好的方法是挑选更好的靶点,以及挑选不会在人类身上出现意外毒性的化合物和靶点。可悲的是,这些正是AI/ML方法目前最没有吸引力的领域,因为要想出一个有用的方法来实现是如此困难。加快筛选或估计物理特性,尽管有很多困难,但却更容易解决。
这并不是一个新的见解。但这是一个难以接受的观点,有几个原因。在这个行业中,我们有非常多的代理测量。我们不得不这样做,因为测量最重要的事情(这种药物对人类疾病是否有效,在多大程度上有效,并且带来的麻烦不能比解决掉的问题多)只能在临床上进行。我们想出了机械性的生化原理、细胞试验、动物试验、化合物结构和物理特性的评估方案,所有这些都是为了在大幕拉开、真正开始时(人类用药)增加我们的成功机会。
这些代用指标产生了大量的数字数据,可以理解,计算方法利用它们来试图做出更好的预测。但最终,它们仍然只是代理变量。
Drug Discov Today文章《药物发现中的人工智能:什么是现实的,什么是幻想的?第一部分。产生影响的方法,以及为什么我们还没有达到目的》
要做出具有足够质量的决策,在某些情况下只能基于我们手头的数据。如果我们想推进药物发现,那么承认一个特定的终点是否适合回答一个特定的问题,至少与建立一个特定的终点模型一样重要。
问题是,建模比处理那个适合性问题更容易开始做。要向投资者、资助机构和高层管理人员解释这一点也可能更难,因为像指标测量质量和靶点选择这样的改进更难量化,而且进展缓慢。对我来说,这是笼罩在许多AI/ML药物发现方法上的一个大问题,我真的很高兴看到一篇论文正面解决这个问题。
另一种AI生成的药物
2020年1月31日,针对Exscientia提出的第一种AI生成的药物进入人体试验,Lowe发表博客文章Another AI-Generated Drug。主要观点如下。
我看到今天有媒体报道“第一种人工智能生成的药物”进入人体试验。有些人会记得以前曾有过类似的说法。
该化合物是DSP-1181,来自Sumitomo和初创公司Exscientia(来自邓迪)的合作。据我所知,它是一种长效5-HT1a激动剂。报道称,它是通过使用筛选潜在化合物的算法创建的,并且1年的时间就进入临床。如果这是准确的,那确实是进入人体试验的捷径,但让我们看看这可能会给你带来什么。这会是一场药物发现革命吗?
问题是,药物临床前优化不是问题。一个针对这一机制的更传统的项目可能是需要两三年的时间才能进入临床试验。重要的是要认识到5-HT1a作为焦虑症和强迫症的靶点并不是一个新的想法。Exscientia有很多关于其靶点选择和化合物优化技术的内容,但在这种情况下,他们正在追求一个已经存在多年的靶点。对DSP-1181的宣传强调了它是一个长半衰期的受体完全激动剂(相对于之前尝试过的一些部分激动剂)。
回到作用方式。我特意用了"猜测"这个词。对于中枢神经系统药物的发现,这就是我们所拥有的一切,不管有没有人工智能。即使是世界上最伟大的人工智能软件,也根本没有足够的可靠信息可供输入,以允许人们预测对强迫症、抑郁症、焦虑症和其他高级人类精神疾病会发生什么。而这正是问题所在。药物在II期失败是因为我们没有选择正确的靶点,因为我们对疾病状态的生物化学理解是错误的和/或不完整的。它们在III期也会因为这个原因和意外的毒性而失败,而毒性的情况与中枢神经系统疗效的情况相同:目前还没有多少人工智能足以告诉你是否会遇到这种问题。也许最终会,但还没有。
那么,我的看法是这样的。Exscientia很可能已经将一个化合物高速推向了临床。但这个特殊的例子并不会大大加快药物发现的速度,因为这只是加快了过程中的一个次要部分,而且(对于这个靶点和适应症)是一个远远没有达到限制速度的步骤。我们已经有了一系列的5-HT1a化合物,而且我们已经有了(多年来)这些化合物可能应用于强迫症的想法。在我看来,这个项目充其量只是在将他们的化合物送入黑盒粉碎机 (black-box shredder) 的过程中节省了几个月的时间,因为每个此类药物项目在进入人体试验时都会进入黑盒粉碎机。在这一点上,我相信他们现在的情况和其他人一样,这意味着失败的几率大于90%。说实话,像这样的中枢神经适应症更像是95%。人工智能并没有改变这一点。我希望它最终能做到。但现在还没有。
到目前为止,AI生成的临床候选药物
2021年11月8日,Lowe发表博客文章AI-Generated Clinical Candidates, So Far。评价了被报道的进入临床的AI生成的药物。主要观点如下。
我们已经到了这样的阶段:有几个进入临床的化合物被称为是由人工智能技术设计的。我总是说我在这种事情上是一个短期的悲观主义者和一个长期的乐观主义者。
对于软件来说,预测一个全新的机制或靶点将是一件非常好的事情,但我们离它仍有一段距离。我们对疾病(以及普通健康)的药理学知识还不够详细。
在化合物的预测层面,一个甚至可以说“这是已知靶点Y的全新配体”的软件系统会令人印象深刻。新化学物质不仅具有专利性,而且具有新的特性(不同的药代动力学、不同的选择性、不同的毒性),不同的可以更好。
已宣布正在进行人体试验的三种AI生成的化合物都来自ExScientia。下面是化学文摘社(CAS)的 Todd Wills对它们的看法(参见本公众号文章CAS博客|首批进入临床试验的AI设计的候选药物:结构新颖性评估),他之前对文献中的新化学结构进行了一些分析。我在这里写了其中的第一个(DSP-1181,一种用于强迫症的 5-HT1a 激动剂),当时我没有可用的结构。但正如我所提到的,靶点是一个众所周知的靶点(至少30 年来,它一直被认为是一种强迫症机制)。
Wills检查了围绕这个靶点的专利数据,发现它与haloperidol (氟哌啶醇,haldol) 相似。可以肯定的是,氟哌啶醇击中了一长串的中枢神经系统受体,而它的5-HT1a活性实际上是其中一个较少的受体。因此,他们很可能在这里找到了一个有用的化合物,但它是在一个非常著名的骨架上。
去年12月,ExScientia宣布了EXS21546的试验,这是一种A2a受体拮抗剂,是一种免疫肿瘤学化合物。EXS21546本身原来与杨森公司以前报道的一些A2a化学物有很强的相似性--它绝不是一个新的化学类型。
今年早些时候传来消息,DSP-0038正作为5-HT1a双重激动剂/5-HT2a拮抗剂进入试验,用于治疗阿尔茨海默氏症相关的精神病。但是,专利中举例的化合物再次与已知的抗精神病药和已知的5-HT配体非常相似。
就目前而言,我认为ExScientia平台最好被描述为一种专利破解工作,或者说是一种自动化的方式,通过药物化学空间的良好表征来寻找可申请专利的化学物质。它是一个fast-follower的机器。如果该软件能够以无监督的方式在知识产权权利要求中进行挑选,那将是一种节省时间的方式,因为从相同空间开始的标准药物化学工作可能也会产生许多实际上无法申请的化合物。
但这绝不是一无是处,因为这些结构即使在可专利性之外仍然具有潜在的优势。而且如前所述,氟哌啶醇-骨架化合物在感兴趣的靶点上似乎比结构相似的最突出的已知化合物要活跃得多,这也是值得高兴的。同时,我认为我们还没有看到ExScientia的5-羟色胺候选物的完整受体活性平面--如果他们真的找到 (dialed out) 了大量的其他结合活性,那将是相当有趣的。
另外,如果软件能够指导合成的方式,使你确信无论你费尽心思制造的是什么,都会在那些法律上明确的空间内,那么时间就会节省下来。
参考资料
https://www.science.org/content/blog-post/ai-and-patent-system
https://www.nature.com/articles/d41586-022-01391-x
Bender A, Cortés-Ciriano I. Artificial intelligence in drug discovery: what is realistic, what are illusions? Part 1: Ways to make an impact, and why we are not there yet. Drug Discov Today. 2021 Feb;26(2):511-524. doi: 10.1016/j.drudis.2020.12.009.
https://www.science.org/blogs/pipeline
https://www.science.org/content/blog-post/another-ai-generated-drug
https://www.science.org/content/blog-post/ai-generated-clinical-candidates-so-far
https://www.statnews.com/2016/03/05/derek-lowe-chemist-blogger/
https://www.allamericanspeakers.com/celebritytalentbios/Derek B. Lowe/438933