Front Pharmacol|DDIT:药物-疾病之间多种临床表型关联预测工具

2022-11-16 17:10:13 浏览数 (1)

2022年1月19日,浙江大学医学院李晨老师团队在Frontiers in Pharmacology上发表文章。作者开发了DDIT(Drug Disease Interaction Type),这是一种用户友好的预测工具,可将多个临床表型整合到有条件的受限玻尔兹曼机(RBM)中,以鉴定药物-疾病关联(drug-disease associations,DDA)的不同表型,包括预测输入中尚不清楚的DDA。

背景

药物再利用(drug repurposing)为高速、低风险药物开发提供了一种有效方法。基于临床表型的筛选在发现一流小分子药物方面超过了基于靶点的方法。然而,大多数这些方法仅预测药物和疾病之间的二元表型关联;药物和疾病的类型尚未得到充分利用。原则上,已知药物的临床表型可分为适应症型(indication,I)、副作用(side effect,SE)和禁忌症(contraindications ,CI)。合并这些药物-疾病相关性(DDA)的不同临床表型可以提高DDA的预测准确性。

方法

由于受限玻尔兹曼机(RBM)可以有效地用于学习多维网络的分布并重构其输入,作者开发了基于RBM的模型DDIT,以预测不同的DDA表型类型。图1显示了DDIT的流程图。

首先,作者分别从PREDICT、SIDER和MED-RT这三个数据库收集不同的表型类型,然后将疾病和药物名称映射到UMLS(Unified Medical Language System,统一医学语言系统)。然后作者构建了一个多维网络,其中节点表示药物或疾病,边缘表示适应症、副作用和禁忌症。格式化的数据被输入到受限玻尔兹曼机(RBM),输出重构了输入。图1以五种药物和四种疾病为例。左矩阵表示三种类型的DDA。对于每个矩阵,行代表药物,列代表疾病。如果Aij=1,则正方形为白色,这意味着药物和疾病具有适应症/副作用/禁忌症,否则为黑色。右矩阵是输出概率。y轴代表药物,x轴代表疾病,z轴代表三种类型的DDA。由于概率在0到1的范围内,因此作者将其着色为灰色。图中I代表适应症;SE代表副作用;CI代表禁忌症。

图1. DDIT模型图

在数据收集阶段,作者收集了2816对药物-适应症对、132150对药物-副作用对和10443对药物-禁忌症对。由于这些数据集是不平衡的,为了平衡数据,作者首先选择了一个疾病子集S,然后从药物-副作用对中随机选择2816(2816是三种类型DDA中的最低计数)关联,从药物-禁忌症中随机选择了2816个关联,作者选择了符合以下两个标准之一的疾病:(1)包括在已知药物适应症中的疾病和(2)由两种不同类型的临床表型共享的疾病。最后,作者获得了每种关联类型的2816个数据点。

DDIT为每种药物建立了RBM模型。对于一种药物,DDIT采用了两层RBM,其中疾病作为可见层,400个隐藏单元作为隐藏层。药物的每个RBM模型仅将与药物相关的疾病作为可见单位。因此,不同的药物具有不同的RBM模型。然而,药物的不同RBM共享每个可见疾病单元和隐藏单元对之间的连接权重。作者假设,对于每种药物,RBM模型有n个可见单元、m个隐藏单元和l个关联类型编码在一个可见单元中。每个可见单元代表一种疾病。令二元向量vi表示第i个可见单元的状态,如果在输入数据中观察到第k种类型的DDA,则vik=1, 否则等于0。例如,对于适应症型DDA,二元向量为vi=(1,0,0),对于兼有副作用和禁忌症型的DDA,二值向量为vi=(0,1,1)。使用3位向量,它将能够同时区分三种类型的DDA。

结果

作者对比了DDIT与基于药物的KNN、基于疾病的KNN,随机森林和XGBoost来评估性能。

与其他四种方法相比,DDIT表示AUC和AUPR分别提高了至少0.217和0.072。图2是DDIT与基于药物的KNN、基于疾病的KNN,随机森林分类器和XGBoost相比的ROC和PR曲线。(A,D)比较DDIT与基于药物的KNN、基于疾病的KNN,随机森林和XGBoost的ROC和PR曲线,以预测已知药物的新适应症。(B,E)比较DDIT与基于药物的KNN、基于疾病的KNN,随机森林和XGBoost的ROC和PR曲线,以预测已知药物的新副作用。(C,F)比较DDIT与基于药物的KNN、基于疾病的KNN,随机森林和XGBoost的ROC和PR曲线,以预测已知药物的新禁忌症。

图2. 不同方法间对比

为验证DDIT发现新的DDA的能力,作者进行了案例分析(case studies)。在三种DDA类型上,用DDIT分别预测原数据集中未记录的DDA,并在CTD, DrugBank和DynaMed这三个新数据集上进行验证。

表1-3表明,对于这三种类型的DDA,DDIT所发现的前10个可能的DDA,大部分能被新的数据库验证。

总结

DDIT可帮助研究人员探索DDA的潜在临床表型,基于不同数据集与各自临床表型的整合,同时预测DDA的多种表型,以对患者进行药物筛选。DDIT使用药物作为可见单位,并为每种疾病建立RBM。RBM可以捕获不同药物的相似性,并可以很好地预测是否遗漏一个疾病类别。

参考资料

Lu et al., DDIT: An Online Predictor for Multiple Clinical Phenotypic Drug-Disease Associations, Front Pharmacol, 2022

--------- End ---------

0 人点赞