而一个好的开源平台也是未来AI医药研发发展的关键之一。
现在,来自加拿大蒙特利尔学习算法研究所(Mila)的唐建团队,就推出了一个专门用于AI药物研发的开源机器学习平台——TorchDrug。
研究人员可以在该平台上免费使用或贡献AI药研相关的算法、库、软件等工具。
唐建表示:
希望这个平台能够将机器学习和生物医学界的研究人员聚集在一起,加速新药发现的过程,并在未来成为该领域一个领先的开源平台。
基于PyTorch的药物研发原型设计平台
TorchDrug涵盖了从图机器学习 (图神经网络、几何深度学习和知识图谱)、深度生成模型到强化学习的技术,基于PyTorch平台。
提供了一个全面而灵活的接口来支持药物发现模型的快速原型设计。
可以用来进行成药属性预测、预训练分子表征、分子生成、逆合成以及知识图谱推理,官方也提供了详细的教程。
该平台主要有四个特点:
- 最小化的领域知识
由于平台主要面向对于医药知识了解不全面的机器学习者,所以抽象了大量专业知识,提供了一个基于张量的接口。从而允许使用者用张量代数和机器学习方法来进行医药开发。
- 大量数据集和构造块(Building Blocks)
这样无需编写样板代码就能很容易地实现标准模型。此外,构建块也具有高可扩展性方便使用者自由探索模型设计。
- 全面的基准测试
为了提供对流行的深度学习框架系统的比较,平台已对现有的一些项目进行了全面的基准测试。测试结果也有望跟踪新模型的进展,激发新的研究方向(可在官网查看)。
- 可扩展训练和推理
可扩展的设计可加速在多个CPU或GPU之间的训练和推理。只需修改一行代码,就能实现在CPU、GPU甚至分布式配置之间无缝切换。
后续团队将通过几何深度学习为该平台增加3D建模功能。
安装接口需Python版本>= 3.5,PyTorch>= 1.4.0,方法有两种:
- 从conda
- 从GitHub源
先通过conda获得TorchDrug依赖的化学信息学开源工具包rdkit:
研发团队
研发团队所在的实验室Mila,是图灵奖得主、加拿大蒙特利尔大学教授Yoshua Bengio于1993年创立的AI研究机构。
有500多名专门从事机器学习的研究人员,主要贡献集中在语言模型、机器翻译、对象识别和生成模型。
TorchDrug平台的开发由Mila实验室的助理教授、加拿大蒙特利尔大学商学院博士生导师唐建领导。
唐教授2014年博士毕业于北京大学信息科学技术学院,2014-2016年任职微软亚洲研究院副研究员,2016-2017年成为密歇根大学和卡内基梅隆大学联合培养博士后。
主要研究方向为:图表示学习、图研究网络、知识图谱、药物发现。
曾获得机器学习顶级会议ICML2014的最佳论文,发表的一系列在图表示学习领域的经典论文包括LINE、LargeVis、RotatE以及Graph Markov Neural Networks (GMNN)。
团队成员还包括多位该实验室的华人博士学生以及来自清华北大上交大的交换生。
还得到了Bengio等十余位AI、生物学领域学者的指导:
TorchDrug官网: https://torchdrug.ai/
GitHub地址: https://github.com/DeepGraphLearning/torchdrug/
参考链接: https://mila.quebec/en/a-team-led-by-mila-researcher-jian-tang-launches-torchdrug-an-open-source-platform-for-drug-discovery/
— 完 —