简读分享 | 乔剑博 编辑 | 龙文韬
论文题目
Integrating and formatting biomedical data as pre-calculated knowledge graph embeddings in the Bioteque
论文摘要
生物医学数据正在快速积累,将其整合到一个统一的框架中是一项重大挑战,因此可以同时考虑给定生物事件的多个视图。在这里,作者展示了 Bioteque,这是一种规模和范围前所未有的资源,其中包含从巨大的知识图谱中提取的预先计算的生物医学描述符,显示超过 45 万个生物实体和它们之间的 3000 万个关系。Bioteque 整合、协调和格式化从 150 多个数据源收集的数据,包括由 67 种关联(例如,“药物治疗疾病”、“基因与基因相互作用”)链接的 12 个生物实体(例如基因、疾病、药物) )。作者展示了 Bioteque 描述符如何促进对高通量蛋白质-蛋白质相互作用组数据的评估,预测药物反应和新的再利用机会,并证明它们可以现成地用于下游机器学习任务,而不会损失使用原始数据的性能。因此,Bioteque 提供了对公共领域可用的生物医学知识进行彻底处理、易于处理和高度优化的组合。
论文链接
https://www.nature.com/articles/s41467-022-33026-0