DRKG | 大规模药物重定位知识图谱

2021-02-01 12:41:59 浏览数 (1)

自2019年12月起,新型冠状病毒迅速在全球扩散,急需快速地发现有效药物。药物重定位是一种将现有药物用于治疗新的适应症的药物发现方式,相对于传统的新药研发,它可以有效缩短药物研发周期,降低成本,规避风险。因此药物重定位是一种非常有前景的新冠肺炎治疗策略。

湖南大学曾湘祥教授课题组,联合亚马逊AI上海、亚马逊AI硅谷、明尼苏达大学、俄亥俄州立大学,共同构建了大规模药物重定位知识图谱(命名为DRKG)和一套机器学习工具,并将其开源给全世界研究者使用。

DRKG是一个综合型生物医药知识图谱(图1),涉及人类基因、化合物、生物过程、药物副作用、疾病和症状六个方面。DRKG从六个公开的大型医药数据库和2200万篇医学文献中挖掘数据,并进行整理和规范化。DRKG知识图谱包含实体数97238个,分为13种实体类型;三元组数目5874261个,分为107种关系类型。

图1 DRKG知识图谱示意图,边上的数字表示关系类型的数量

机器学习工具使用了先进的深度图学习方法(DGL-KE)来学习DRKG中实体和关系的低维向量表示(embeddings),并使用这些embeddings来预测药物治疗疾病的可能性或药物与疾病靶点结合的可能性。

湖南大学、亚马逊AI与克利夫兰医院的研究者在COVID-19上的实验(如图2)表明:使用大规模知识图谱和表示学习模型进行冠状病毒的药物发现,能以较高的分数识别出目前正在进行临床试验的多种冠状病毒候选药物。

作者在Github上公开提供了DRKG、机器学习工具以及训练好的embeddings数据,以帮助相关研究人员更有效地对新冠病毒及其它疾病(如阿尔茨海默病)进行药物重定位研究。

Github链接

https://github.com/gnn4dr/DRKG

0 人点赞