据葛兰素史克(GSK)官网称,GSK在2020年的一个季度中生成的数据,比公司之前300年的历史中生成的还要多。GSK正在以前所未有的速度、规模和精度解码这些数据。
本文对近年来 (2020年1月至今) GSK在AI药物研发方面的11篇论文 (不完全统计) 进行整理。
深度度量学习在分子图相似性中的应用
Coupry DE, Pogány P. Application of deep metric learning to molecular graph similarity. J Cheminform. 2022 Mar 12;14(1):11.
doi: 10.1186/s13321-022-00595-7.
几十年来,量化化学结构的相似性一直被频繁用于药物发现,并且经常被用作先导化合物优化的设计原则。
基于图的方法在化学和药物发现中越来越重要,其应用范围从QSAR到分子生成。结合图神经网络和深度度量学习的概念,我们提出了一个框架,用于量化分子图的相似性,该框架基于独立于任何端点的学习嵌入之间的距离。
使用相似性的最小定义和来自公共化合物ZINC数据库的数据,这项工作展示了嵌入的特性及其对一系列应用的适用性,其中包括一种用于训练深度分子自动编码器的新型重建损失方法。
训练期间的triplet loss (深度学习的一种损失函数) 嵌入的架构
分子生成的图灵测试
Bush JT, Pogany P, Pickett SD, Barker M, Baxter A, Campos S, Cooper AWJ, Hirst D, Inglis G, Nadin A, Patel VK, Poole D, Pritchard J, Washio Y, White G, Green DVS. A Turing Test for Molecular Generators. J Med Chem. 2020 Oct 22;63(20):11964-11971.
doi: 10.1021/acs.jmedchem.0c01148.
分子生成要求在适当的化学空间内设计出高质量、类似药物的分子。许多算法已被提出用于分子生成。然而,一个挑战是如何评估所产生的分子的有效性。
本文报告了三个由图灵测试启发的测试(human inclusion、human imitation、legacy projects),旨在评估三种分子生成算法(BioDig、BRICS、RG2Smi)的性能。
human inclusion测试探索了三种算法重现GSK药物化学家想法的能力(化学家的想法被用作测试集,以探索算法复制药物化学家探索化学空间方法的能力);human imitation测试探讨了药物化学家如何感知额外的算法生成的想法(从图灵测试中获得灵感,并请药物化学家对人类和计算机的想法进行评分,以确定两个数据集的可信度是否存在差异);legacy projects测试探索了三种算法围绕一个先验的起始结构生成一个广泛但与生物相关的化学空间的能力。
在这些测试中,分子生成算法的性能之间存在着深刻的差异,突出了为特定情况选择适当的设计算法的重要性。
其中一个基于匹配分子对的分子生成算法在所有测试中都表现出色,因此为机器驱动的药物化学设计工作流程提供了一个有价值的组成部分。
使用匹配的分子对进行分子设计
Pal S, Pogány P, Lumley JA. Molecule Ideation Using Matched Molecular Pairs. Methods Mol Biol. 2022;2390:503-521.
doi: 10.1007/978-1-0716-1787-8_23.
匹配分子对分析(Matched Molecular Pair Analysis,MMP)是药物发现中lead优化阶段的一个非常重要的工具。MMP分析的吸引力在于它能够直观地将结构变化与相关性质的变化联系起来。
这个工具在lead优化阶段的作用已经在几篇同行评议的文章中讨论过了。MMP在分子生成中的应用是比较新的。这带来了一些挑战,其中之一是需要将背景信息编码到transforms中。在这一章中,我们讨论了我们如何使用MMPs作为分子生成方法,以及它与其他分子生成方法的比较。
(本文是Artificial Intelligence in Drug Design一书的一章,该书见Springer推出新书《Artificial Intelligence in Drug Design》)。
ProtoCaller:结合自由能计算的强大自动化方法
Suruzhon M, Senapathi T, Bodnarchuk MS, Viner R, Wall ID, Barnett CB, Naidoo KJ, Essex JW. ProtoCaller: Robust Automation of Binding Free Energy Calculations. J Chem Inf Model. 2020 Apr 27;60(4):1917-1921.
doi: 10.1021/acs.jcim.9b01158.
蛋白质-配体结合自由能模拟是促进药物发现的一种越来越有前途的方法。然而,以不偏不倚的方式完全自动化每个蛋白质-配体系统的设置并不总是可行的。每个系统设置都需要多个步骤以及不同程度的用户干预。这意味着系统准备可以说比数据生成更耗时,并且是确定由此产生的自由能的关键步骤。
本文描述了ProtoCaller,这是一个开源的conda可安装Python库,它试图通过为自由能工作流的所有步骤提供可定制的统一接口来解决上述挑战。
ProtoCaller可以自动计算GROMACS中的相对蛋白质-配体结合自由能。它链接了许多用于执行蛋白质设置和参数化的流行专业工具,例如PDB2PQR、Modeller和AmberTools。ProtoCaller支持带有附加辅因子参数的常用 AMBER力场,AM1-BCC用于推导配体电荷。ProtoCaller还带有一个广泛的PDB解析器、一个增强的最大公共子结构算法,提供改进的配体-配体映射,以及一个用于运行多个分子动力学模拟的轻型GROMACS wrapper。ProtoCaller与生物分子模拟领域的大多数研究人员高度相关,允许在自动化和用户干预之间实现可定制的平衡。
BRADSHAW:自动化分子设计系统
Green DVS, Pickett S, Luscombe C, Senger S, Marcus D, Meslamani J, Brett D, Powell A, Masson J. BRADSHAW: a system for automated molecular design. J Comput Aided Mol Des. 2020 Jul;34(7):747-765.
doi: 10.1007/s10822-019-00234-8.
本文介绍了BRADSHAW,这是一种自动化分子设计系统,它集成了化学结构生成、实验设计、主动学习和化学信息学工具的方法。简单的用户界面旨在促进访问大规模自动化设计,同时最大限度地减少引入新算法所需的软件开发,这是一个快速发展的领域的关键要求。该系统体现了自动化理念、最佳实践、实验设计以及传统化学信息学和现代机器学习算法的使用。
BRADSHAW系统概述
文献挖掘和机械图形建模以改进mRNA疫苗平台
Leonardelli L, Lofano G, Selvaggio G, Parolo S, Giampiccolo S, Tomasoni D, Domenici E, Priami C, Song H, Medini D, Marchetti L, Siena E. Literature Mining and Mechanistic Graphical Modelling to Improve mRNA Vaccine Platforms. Front Immunol. 2021 Sep 7;12:738388.
doi: 10.3389/fimmu.2021.738388.
RNA 疫苗代表了疫苗学史上的一个里程碑。与更传统的疫苗开发方法相比,它们提供了几个优势,显示出强大的免疫原性和整体良好的安全性。虽然临床前测试提供了一些关于RNA疫苗如何与先天免疫系统相互作用的关键见解,但它们的作用机制在文献中似乎是零散的,因此难以制定新的假设以在临床环境中进行测试并最终改进该技术平台。
在这里,我们提出了一种基于文献挖掘和机械图形建模相结合的系统生物学方法,以巩固围绕mRNA疫苗作用模式的现有知识,并提高临床前假设到临床证据的可转化性。
用于自动知识提取的自然语言处理 (NLP) 管道检索了关键的生物学证据,这些证据被加入到一个交互式机械图形模型中,该模型表示由mRNA疫苗给药诱导的免疫事件链。所获得的机械图形模型将有助于未来实验的设计,促进新假设的产生,并为开发能够模拟和预测对mRNA疫苗的免疫反应的数学模型奠定基础。
人工智能在生物技术大数据领域的未来
Artico F, Edge Iii AL, Langham K. The future of Artificial Intelligence for the BioTech Big Data landscape. Curr Opin Biotechnol. 2022 Apr 29;76:102714.
doi: 10.1016/j.copbio.2022.102714.
最近的工业4.0进步为开发创新的生物技术解决方案提供了大量数据。然而,需要克服几个挑战才能正确使用数据和新颖的非传统制药技术,以大大加快产品和服务的发现、优化和市场交付。
本文讨论了大数据和人工智能对该领域的未来产生影响的重要方面,并简要介绍诸如超自动化、基础设施即代码 (IaC) 和DevOps (一套将软件开发与信息技术运营相结合的实践) 如何加速大数据和AI的采用。
(本文为阿斯利康和GSK共同发表,见近年来阿斯利康在AI药物研发领域发表的15篇论文)
加速纯化工艺开发的最新进展:以疫苗为重点的综述
Keulen D, Geldhof G, Bussy OL, Pabst M, Ottens M. Recent advances to accelerate purification process development: A review with a focus on vaccines. J Chromatogr A. 2022 Aug 2;1676:463195.
doi: 10.1016/j.chroma.2022.463195.
疫苗的开发耗费时间,而且非常昂贵。
高通量技术极大地增加了与工艺有关的数据量,结合统计学和机械学建模,新的高通量工艺开发(HTPD)方法逐渐形成。基于模型的HTPD的引入使人们能够更快和更广泛地筛选条件,并进一步增加知识。基于模型的HTPD对色谱法尤其重要,因为它是实现高纯度的关键分离技术。
本综述概述了(生物)制药行业内使用的下游工艺开发策略和工具,重点关注(蛋白质亚单位)疫苗纯化过程。随后讨论了高通量工艺开发和其他组合方法,并根据其实验努力和理解进行了比较。在不断增长的信息海洋中,新的建模工具和人工智能(AI)在寻找数据背后的模式,从而获得更深入的过程理解方面越来越重要。
工艺开发的未来方向是在计算机上设计和优化整个下游工艺,只需要有限数量的模型校准和验证实验。
迈向疫苗的计算机过程建模
Cardillo AG, Castellanos MM, Desailly B, Dessoy S, Mariti M, Portela RMC, Scutella B, von Stosch M, Tomba E, Varsakelis C. Towards in silico Process Modeling for Vaccines. Trends Biotechnol. 2021 Nov;39(11):1120-1130.
doi: 10.1016/j.tibtech.2021.02.004.
化学、制造和控制开发的时间占据了疫苗端到端开发的重要部分。在不断加快时间的竞赛中,计算过程开发是一个可行的战略,可以通过人工智能(AI)驱动或机械导向的方法实现。
在本文中,我们将重点放在机械化的选择上,并报告实现这一目标所需的建模能力。通过检查最频繁的疫苗过程单元,我们发现流体力学、热力学和运输现象、细胞内建模、混合建模和数据科学,以及基于模型的实验设计是疫苗开发的支柱。此外,我们还设计了一个通用的途径,将建模能力纳入计算过程开发战略。
用于药物警戒的人工智能和机器学习
Bate A, Luo Y. Artificial Intelligence and Machine Learning for Safe Medicines. Drug Saf. 2022 May;45(5):403-405.
doi: 10.1007/s40264-022-01177-0.
药物警戒 (Pharmacovigilance, PV) 正处于一个巨大的变革时期,人们对包括ML在内的新技术在推动这一必要变革中所能发挥的作用进行了大量讨论。
AI和ML在药物警戒领域的常规使用很有限,这有很多原因。然而,有迹象表明,这种情况正在发生变化,其中一些障碍开始被克服。特别自然语言处理在从电子健康记录的自由文本中提取信息方面得到了广泛使用。
AI和ML在药物警戒领域的广泛应用包括:预测药物审批、患者自动报告不良事件、药物编码、不良事件报告因果关系评估、疾病预测等。
(本文收录于《AI和ML在药物警戒中的作用》专辑介绍)
人工智能、真实世界自动化和药物警戒
Bate A, Hobbiger SF. Artificial Intelligence, Real-World Automation and the Safety of Medicines. Drug Saf. 2021 Feb;44(2):125-132.
doi: 10.1007/s40264-020-01001-7.
尽管以电子方式捕获、存储、链接和分析数据的能力取得了巨大的技术进步,但对常规药物警戒的影响有限。我们讨论了在包括预许可在内的药物警戒生命周期中使用人工智能、机器学习和自动化的新兴研究。提供了为什么具有挑战性的原因,我们还提供了加速采用所需的改变的观点,从而提高患者的安全性。
最后,我们明确指出,虽然技术可以叠加在现有的药物警戒流程上以进行渐进式改进,但这些数据和技术方面的巨大社会进步也为我们提供了一个及时的机会来重新考虑我们在药物警戒业务中所做的一切,以最大限度地利用这些进步的好处。
人工智能/机器学习 (ML) 和自动化在药物警戒 (PV) 中的新兴和潜在用途
参考资料
https://www.gsk.com/en-gb/behind-the-science-magazine/ai-and-ml-power-better-predictions-for-patient-impact/
--------- End ---------