大分子药物发现中的人工智能公司格局

2023-09-24 09:24:00 浏览数 (1)

编译 | 曾全晨

今天为大家介绍的是来自Navraj S. Nagra团队的一篇论文。

人工智能(AI)技术,如机器学习,正在改变药物研究和开发(R&D)领域,得益于不断增长的数据和计算能力。历史上,小分子化合物一直是药物发现中应用AI的前沿,包括建模小分子与靶点的相互作用、优化潜在候选药物和预测安全性。然而,AI工具越来越多地应用于大分子药物类型,包括抗体、基因疗法和基于RNA的疗法。这些疗法占据了生物制药行业当前产品组合的重要份额,2022年获批新分子药物中约占40%,并且具有未来商业潜力。例如,在肿瘤领域,大分子药物预计将在2030年占市场收入的约50%,其中超过80%预计将来自抗体。

人工智能在大分子药物发现中的应用

药物研发的许多领域都在应用机器学习工具。在这里关注大分子药物发现的三个相互重叠的方向——结构预测、功能预测和新候选物生成——这些方法正在迅速成熟。文章不涵盖在药物开发中应用的机器学习工具,如预测响应性患者人群,或者降低风险或加速临床试验。

预测大分子结构的工具:蛋白质结构的预测对大分子药物发现具有重要价值,涵盖领域从靶标识别(如预测抗原结构)到引物识别和优化。AlphaFold2是一个机器学习模型,在2020年成功地从氨基酸序列单独预测出三维蛋白质结构,成为了一个里程碑式的突破。许多领域内的公司现在正在使用AlphaFold2或其他具有类似准确性的蛋白质结构预测模型,如RoseTTAFold。持续的发展正在改进易用性、可扩展性、孤儿蛋白质的性能以及可重新训练性,并且使用类似于大语言模型GPT-4的不同架构增加泛化能力和速度。

预测大分子功能的工具:已开发出人工智能工具来支持大分子治疗候选物功能的预测,包括抗原-抗体或RNA-蛋白质结合,以及与其可开发性相关的方面,如药代动力学清除。这些预测可以使用机器学习模型,如梯度提升树,或计算模型,如分子动力学模拟来进行。最近,也采用了深度学习方法,包括基于图的模型、卷积神经网络、循环神经网络或“大分子语言模型”,用于预测关键的治疗性能,如抗体亲和力。这些方法可以使用大分子的各种表示方式;例如,抗体-抗原氨基酸的三维坐标,或者用于卷积神经网络或大分子语言模型架构的氨基酸或核苷酸序列。

生成大分子治疗候选物:不断增长的数据可用性支持开发可以大规模生成蛋白质、抗体或mRNA的算法,作为引导物生成或优化的一部分;例如,基于扩散、变分自编码器模型,或通过使用类似于在该模式下特定数据上训练的GPT-4的大语言模型,如蛋白质序列。

新兴的公司格局

图 1

作者分析了在大分子药物设计领域从事AI驱动生物技术公司的格局,并识别出了82家在这一领域活跃的公司(图1a)。其中超过60%的公司是在过去5年内成立的,这表明该行业正在初创阶段,受到了最近技术飞跃的推动,比如AlphaFold的出现。此外,也出现了这些公司之间的一些合并迹象,比如iBio于2022年收购了RubrYc Therapeutics。这些公司在2021年共筹集了39亿美元的资金,其中27亿美元由风险投资公司独自投资(图1b)。然而,在2022年,总投资额显著下降至7亿美元(图1a)。值得注意的活动包括AbCellera和Absci(均专注于抗体发现)在2020年和2021年分别通过首次公开募股筹集了5.55亿美元和2亿美元,并且Generate Biomedicines(专注于蛋白质药物发现)在2021年通过B轮融资筹集了3.7亿美元。

已建立的生物制药公司正投资于在大分子药物发现领域建立AI能力,包括内部建设和通过收购,例如Genentech在2021年收购了Prescient Design,这是一家应用机器学习进行抗体发现的AI驱动生物技术公司。已建立的大型生物制药公司还与AI驱动的生物技术公司建立合作伙伴关系,在2021年共识别出51个合作伙伴关系,而2016年仅有10个合作伙伴关系(图1a)。交易示例包括BigHat Biosciences(专注于抗体发现)与安进、AbCellera与AbbVie、MAbSilico(专注于抗体发现)与OSE Immunotherapeutics之间的合作伙伴关系。

AI驱动的生物技术公司的项目流水线目前处于早期阶段(图1c)。在II期临床研究中已经有了三个成果:Evaxion正在开发基于肽的个体化癌症免疫疗法,用于治疗转移性黑色素瘤;ZielBio正在开发针对固体肿瘤的抗plectin单克隆抗体;PharmCADD拥有一种针对SARS-CoV-2的mRNA疫苗候选药物。在I期临床研究中也有三个成果:Peptilogics的用于人工关节周围感染的肽类抗生素,SparX Therapeutics的用于胃癌的靶向claudin 18.2的单克隆抗体,以及PharmCADD的另一种针对SARS-CoV-2的mRNA疫苗。

开发这些分子的公司报告称在候选药物开发过程中利用了基于AI的靶点识别、功能(结合)预测和抗体生成(包括生成AI的使用)。在临床前研究项目中,AI驱动的生物技术公司正在开发的资产中,肿瘤学领域的项目数量最多,有八个分子。在治疗模式方面,临床前开发中的RNA治疗和肽类药物(占所有分子的约50%)多于抗体治疗。这可能是因为抗体设计的复杂性更高,缺乏用于训练机器学习工具的功能性数据。

参考资料

Navraj S. Nagra, Lieven van der Veken, Erika Stanzl, David Champagne, Alex Devereson & Matej Macak. The company landscape for artificial intelligence in large-molecule drug discovery.

https://doi.org/10.1038/d41573-023-00139-0

0 人点赞