2022年3月8日,赫尔辛基大学芬兰分子医学研究所的Tero Aittokallio在Expert Opinion on Drug Discovery杂志发表评论文章,总结了机器学习在药物发现和再利用中面临的挑战、以及应对措施。
主要内容整理如下。
1. 引言
近年来,机器学习(ML)方法已越来越多地被用于计算机辅助药物发现。
这一快速进展主要是由于可用于ML模型训练的大规模数据集,以及深度学习(DL)和其他人工智能(AI)方法的发展,这些方法能够综合利用各种各样的化合物和靶点数据(从化学结构到生物化学、体外、体内和临床终点),为治疗反应建模。在药物发现和开发的所有阶段都有应用ML和AI方法的激动人心的机会,包括靶点识别和验证、分子结构和功能的预测以及化合物的筛选和优化。
此外,基于高质量的训练数据,监督学习和特征选择为识别精准医疗的预测性生物标志物提供了系统的手段;例如,使用临床数据,这种预测方法可以为设计基于标志物的试验和改进患者选择提供治疗反应的真实证据。特别是在过去几年中,ML在癌症检测和诊断、确定抗癌药物发现和再利用的新靶点、预测癌症患者的治疗结果方面取得了巨大进展。
然而,正如最近在COVID-19检测和预后的ML模型的快速发展和应用中所显示的那样,新模型的最终医疗效果可能仍然相当有限,除非更加关注严格的、往往是漫长的模型验证过程和训练数据集的潜在偏差。
最近的一份报告显示,迄今为止,使用胸片和CT扫描开发的ML模型没有一个具有潜在的用于COVID-19管理的临床用途,主要原因是用于模型训练的成像数据集存在方法学缺陷和高风险或不明确的偏差。
ML在对抗COVID-19方面的另一个重要应用是药物筛选和再利用。由于开发新药既费钱又费时,所以有几项工作都是针对探索现有药物来治疗COVID-19。然而,在COVID-19大流行的第一年后,药物再利用并没有产生新的治疗方案。这并不意味着药物再利用概念本身的失败,而是意味着开发可用于临床的治疗方法需要时间 (即使采用新的和加速的方法)。事实上,越来越多的再利用药物与一些新的候选药物一起继续被考虑进行临床试验。
为了应对这些挑战,社区最近已经制定了提高ML模型质量和适用性的指导方针,例如,根据既定的标准和质量指标,在精心收集的外部验证数据中对其进行基准测试,作为社区范围内基于ML的研究的建议、以及代码发布和工作流程自动化的标准和最佳实践而实施。
本文提到的社区制定的提高ML模型质量和适用性的指导方针
见Walsh I, Fishman D, Garcia-Gasulla D, et al.
DOME: recommendations for supervised machine learning validation in biology. Nat Methods. 2021;18(10):1122–1127.
ML开发者和生命科学期刊对这些建议的广泛采用,将改善未来对基于ML的研究的评估和可重复性。对于将代码和数据提供给他人同样重要的是,ML模型也将被实施为易于使用的网络应用程序,以促进其在社区的广泛使用(也包括没有编程技能或生物信息学支持的研究人员),同时确保建模标准得到维护。这对复杂的DL算法尤其重要,因为缺乏用户友好的解决方案可能会阻碍药物发现和再利用专家在实践中使用这些算法。
另一个及时的问题是如何有效地整合多模式和多尺度 (multi-scale) 的数据,以指导药物发现过程,建立临床前模型和预测患者的药物反应。
目前已有一些研究解决方案,但尚未在药物发现管线中广泛使用。目前已经开发了多种学习方法,用于根据选定的大数据资源系统地识别药物再利用线索,如药物结构和靶点概况与细胞模型的多组学数据相结合,但目前缺乏的是基于网络的平台,将所有这些数据整合成易于访问的摘要,供药物发现和再利用社区在确定进一步临床前和临床开发线索的优先顺序时使用。同样,尽管在临床前疾病模型(包括患者来源的原代细胞、器官和异种移植)中预测药物反应的人工智能算法发展得越来越准确,但对患者临床反应进行准确和可操作的预测的解决方案仍然有限。
2. 当前和新出现的挑战
下面,本文将强调从临床前到临床开发和实际实施的四个关键挑战,这将需要新的机器学习解决方案来支持真正的数据驱动、可操作和透明的决策过程,以加快药物发现过程并降低临床开发阶段的失败率。
组合的计算和实验挑战
治疗复杂的疾病,如病毒感染和晚期癌症,往往需要药物组合。然而,由于潜在的化合物和靶点组合的数量呈指数级增长,系统设计和筛选组合空间的表型效应构成了计算和实验的挑战。虽然有许多ML模型被开发出来用于预测成对的药物剂量组合反应,但系统地预测两个以上药物或靶点的高阶组合效应仍然是一个未解决的挑战。
张量学习模型已经能够准确预测癌症细胞系的成对药物组合剂量反应矩阵,这种计算效率高的学习方法也可以应用于其他类型的临床前模型。
ML模型忽略了潜在的毒性或疗效选择性
目前大多数用于治疗反应预测的ML模型将疗效作为主要结果,而忽略了潜在的毒性或疗效选择性(在疾病和健康细胞中疗效和毒性的差异),尽管这些是临床开发成功的关键因素。因此,有必要仔细评估和预测已经在临床前和计算模型中的化合物的毒性作用,以平衡治疗效果和可容忍的毒性,从而加快药物开发的下一步并降低风险;单细胞数据和ML模型的使用已经显示出寻找抗癌组合的前景,这些组合可以选择性地共同抑制恶性细胞,同时避免抑制非恶性细胞,从而增加其临床成功的可能性。
迁移学习和计算细胞类型去卷积方法可以提供实用的解决方案,避免通过实验产生大量仍然相当昂贵的单细胞数据,以预测联合疗法的反应,以及毒性作用,甚至是优化疗效和安全性的剂量。
治疗反应预测必须在病人数据和临床结果中得到验证
计算的治疗反应预测必须在病人数据和临床结果中得到验证。这种对ML预测的真实世界证据对于临床开发和建立决策过程中的实际效用和临床影响至关重要。目前在应用ML进行药物发现,特别是临床开发时面临的许多挑战,与目前人工智能算法的标准与临床研究所需的标准不匹配有关。因此,系统和全面的高质量临床数据集是ML模型验证的关键所在。新的发现工作流程需要根据社区共识性能指标仔细验证准确性和可重复性,在广泛的现实场景下,不仅在有限范围的基准数据集中。
敏感患者数据的共享和重用可以使用划分代码和数据的技术,或通过所谓的“模型到数据”概念来完成。这使联邦学习能够利用患者级别的数据进行模型开发和系统基准测试。
可解释性的挑战
尽管药物发现的应用越来越多,但大多数ML,特别是DL模型仍然是"黑箱",往往难以被人类专家解释。作为基于网络的决策支持系统实现的数学模型需要对用户透明;特别是,专家系统必须公开其预测规则,并进行不确定性估计,以便用户能够获得信心。可解释、透明和可说明的模型涉及对优化目标(如协同作用、疗效和/或毒性)的明确描述,以及定量的性能和不确定性评价(如交叉验证、符合性预测和真实世界的验证),这有助于用户决定如何和何时使用算法以获得有效的结果并改善决策。
例如,人在环中(human-in-the-loop)强化学习可以在互动决策过程中使用专家建议,以提高ML指导的药物发现过程的可解释性。然而,在部署后需要定期进行质量监测和保证,以确认模型在一段时间内和多个发现应用中的稳健和性能改进。
3. 专家意见
一旦上述挑战得到妥善解决,无论是实施改进的方法还是部署和采用这些方法,我相信下一代ML和AI指导的专家系统将提供真正有影响力和值得信赖的计算工具,为加速发现新药、治疗靶点和药物组合提供可操作和可测试的假设。
重要的是,ML开发者应该坚持模型和代码共享、基准和可重复性的社区标准,特别是对于临床开发。同样,该领域的期刊应该继续执行标准化的最佳实践清单,将基于ML的发现作为出版的要求。只有这样,我们研究界才能提供新的解决方案,例如,基于ML建模和综合多模态分析的药物疗效和安全性评估。
就像在COVID-19大流行期间所证明的那样,开放科学和快速分享研究成果是整个社区的基准和众包开发新的、急需的治疗现有和新出现的疾病的关键。
参考资料
Aittokallio T. What are the current challenges for machine learning in drug discovery and repurposing? Expert Opin Drug Discov. 2022 May;17(5):423-425. doi: 10.1080/17460441.2022.2050694.
--------- End ---------