利用人工智能增强表型药物发现

2021-06-07 15:13:46 浏览数 (2)

过去的三十多年里,基于靶点的药物发现(Target-based Drug Discovery, TDD)是药物发现的主要方法。由于靶点明确,使用TDD很容易设计药物筛选试验,因此在过去有大量的成功案例。使用TDD方法来开发药物,药物发现的时间、过程和所需资源都是可预测的。

然而即便人们已经发现了大量的潜在靶点,但是确认的、既符合疾病相关性又具有可接受的安全风险的靶点仍然很少,TDD没有像最初希望的那样富有成效。

近年来,随着细胞表型筛选技术,如诱导多能干细胞(iPS)技术、CRISPR-Cas技术、类器官和成像分析技术的飞速发展,表型药物发现(Phenotypic Drug Discovery, PDD)重新回到了人们的视线。

从PDD到TDD再到PDD

1980年左右的时候,大多数药物的发现主要使用PDD。PDD常见的范式就是评估一个化合物能否在某个生理模型中显示出预期的反应。

后来,随着人类基因组测序、基因克隆方法、生物测定技术以及晶体学等技术的进步,靶点假设驱动的测定方法日益突出,人们的注意力转向了TDD。

然而,人们对TDD的希望并没有在临床中轻易地转化为成功。于是,生理的、与疾病相关的表型筛选模型又重新得到重视。

PDD不使用特定的分子靶点作为药物发现的起点,而是直接使用生物系统进行新药筛选。在PDD中,化学物质直接“访问”生理相关的生物系统或细胞信号通路,以鉴定生物活性化合物。PDD的启动与靶点无关,这是它与TDD的根本区别。

但是PDD方法也面临相当大的挑战:由于缺乏有效的方法来处理和优化靶点,PDD往往产生质量不高的先导化合物,也会导致药物开发管线的过载。

那么有什么方法能够改进或优化PDD呢?

2021年1月,牛津大学Paul R.Riley等人在《Drug Discovery Today》杂志发表文章,文章比较了TDD和PDD的差异,并讨论了AI在加速和增强PDD中的新应用,以及如何克服PDD流程中的障碍。以下是全文的主要内容。

01

TDD与PDD的比较

TDD从一开始就形成以靶点为中心的假说,在构效分析中快速确定候选药物的优先级,快速转化到临床路径。在某些情况下,TDD是唯一的选择,比如疾病的生物学性质很复杂、表型模型不可用的时候。但是TDD的主要风险是靶点和疾病生物学之间的联系不紧密,加之靶点内在的适应性以及靶点之间可能的相互作用,导致临床转化成功率较差。

PDD不预设靶点,这样就可以发现新的作用方式,并且扩展对某些疾病的生物学认识。如果仔细设计,PDD可以提供强大的临床转化效率。PDD的另一个吸引人的特点是,它允许多种化学实体的筛选,特别是在肿瘤学领域。

关于PDD和TDD哪一种方法的成功率更高,争论不一。事实上这也跟具体的疾病领域和药物发现管线的总体设计密切相关。值得一提的是,生物药通常来源于靶向筛选,大多数抗生素来源于表型筛选。

尽管PDD的相关技术,如诱导多能干细胞(iPS)技术、CRISPR-Cas技术、微流控技术、成像技术以及生物信息学数据分析工具近年来飞速发展,然而PDD仍然被认为是药物研发管道中的高风险选择:在开始之前,需要花费大量时间和资金建立复杂的细胞分析模型。

02

AI在PPD中的应用

机器学习是AI领域的一个强大的分支,它通过复杂的数据决策方案加速转化研究。

在过去的10年里,AI方法学和机器学习算法已经成功地应用于药物发现的各个阶段,并逐步融入到大型制药公司的药物发现策略中。

机器学习可以解析和重组数据关系,创建有用的预测模型,有助于克服PDD流程中存在的障碍。主要作用有以下几方面。

筛选和图像分析

在某些大型的高通量成像试验中,生物系统的所有形态特征被整合起来进行系统研究,即基于图像或形态的分析。多参数分析测量到的表型变化,可以用来总结细胞对特定化合物的反应,为潜在的作用方式和信号通路的研究提供有价值的见解。

利用监督机器学习进行表型图像分析的流程

2016年,细胞画像(cell painting)作为一种基于高通量图像的形态学分析方法被引入进来。自动化的图像处理工具可以测量数千种形态特征,然后借助AI来评估化合物的作用。

化合物库的开发

近年来,新型的计算工具被引入,用来设计具有类药性、结构多样性和形状复杂性的分子支架。深度学习算法已经在这方面得到了应用,如化学网络(Chemi-Net,一种分子图卷积网络与多任务DNNs的组合)用于识别具有理想的吸收、分布、代谢、排泄(ADME)特性的化合物。机器学习的应用带来了快速优化化合物指纹设计的新方法,该方法具有最大的化学和生物空间覆盖,更少的噪声和最大的数据覆盖。

而且,现代化学信息学的方法已经可以借用新型软件和机器学习算法的力量,根据化学结构、结合选择性、表型效应等,来创建定制的集成化合物库。

化合物设计和先导化合物发现

目前,深度学习已经被应用于逆合成分析与路线设计,在反应技术和合成方法方面也有新进展。系统生物学和化学合成都已尝试使用DNN,特别是生成对抗网络,用于类药化合物的从头设计。

靶点反卷积

FDA允许在没有已知靶点的情况下开展临床试验。然而,了解作用方式有不可否认的价值,而且对候选药物进行多变量表征的需求越来越大。机器学习可以在表型筛选中将细胞表型与化合物作用方式联系起来,获得靶点、信号通路或遗传疾病关联的聚类。

生物标志物鉴定、患者分层

使用生物标志物进行患者分层可以提高临床试验的成功率。目前的疾病生物标志物鉴定方法主要依赖于固定的组织学样本和静态的生物标志物,其信息容量和可靠性往往有限。机器学习在生物标志物发现和药物敏感型预测方面的应用可以作为快速、经济的精准医学方法。

在活细胞高通量微流控分析中,使用定制的机器学习软件和随机森林分类算法可以对活细胞和固定细胞分析的结果进行交叉验证。此外,使用细胞画像的方法可以对疾病相关的基因和等位基因进行功能注释。

副作用预测

机器学习和人工智能可以帮助人们利用人类遗传学数据,来预测治疗效果,阐明与特定药物和/或靶点相关的安全问题。机器学习可以在临床前设计阶段预测小分子的毒理学情况。

药物重定向和脱靶效应预测

药物重定向是一种具有吸引力的快速解决方案。目前已有一些机器学习驱动的平台用于药物重定向,辅助表型分析。此外,一些研究综合分析了基因-药物表型关系,创建了多参数的化学-遗传交互作用图,来预测脱靶效应。

图像结果的再利用

表型筛选和高通量成像项目的一个具有吸引力的选择,是重新利用实验的图像结果。一些试验的图像结果可以为其他项目的生物活性研究提供预测,加快药物发现的速度和效率。

03

结束语

完全以靶点为中心的药物发现方法,或许不是一个稳健的解决方案。采用疾病相关的、生理相关模型的PDD方法,具有识别出可转化于临床的新分子实体的潜力。同时,形态分析利用细胞表型变化反映出来的丰富信息,将推动新的化合物的发现,增强我们对生物学的理解。

AI和机器学习工具可以利用表型分析的优势,减少与之相关的时间和成本需求,同时协助靶点反卷积、毒性预测和患者分层。如何把这些数据驱动的方法整合到有效的药物发现中?PDD方法和跨学科合作将是关键。

参考资料

Moffat JG, Vincent F, Lee JA, Eder J, PrunottoM. Opportunities and challenges in phenotypic drug discovery: an industryperspective. Nat Rev Drug Discov. 2017 Aug;16(8):531-543. doi:10.1038/nrd.2017.111.

Malandraki-Miller S, Riley PR. Use ofartificial intelligence to enhance phenotypic drug discovery. Drug DiscovToday. 2021 Jan 20:S1359-6446(21)00040-4. doi: 10.1016/j.drudis.2021.01.013.

(Chris)

----------- End -----------

0 人点赞