MDNN: 一种用于药物-药物反应预测的多模态深度神经网络

2021-09-17 11:44:57 浏览数 (1)

今天介绍的是中南大学高建良团队和他人合作发表在IJCAI2021上的一篇文章“MDNN: A Multimodal Deep Neural Network for Predicting Drug-Drug Interaction Events”。本文指出许多基于人工智能的技术已经被提出并用于预测药物-药物反应(DDI),而现有的研究方法较少关注DDI与靶标、酶等多模态数据之间的潜在相关性。为了解决这一问题,作者提出了一个用于DDI预测的多模态深度神经网络(MDNN)。本文设计了一个基于药物知识图谱(DKG)的通道和基于异质特征(HF)的通道的双通道框架来获取药物的多模态表征。最后,通过一个多模态融合神经层来探索药物多模态表征之间的互补关系。作者在真实数据集上进行了广泛的实验。结果表明,MDNN能够准确预测DDI,并优于现有的模型。

1.摘要

随着药物种类的快速增长,在多药联合治疗的情况下,药物安全管理变得尤为重要。在同时给药的情况下,经常发生药物-药物相互作用(drug - drug Interactions, DDIs),这可能导致药物不良反应,造成伤害和巨大的医疗费用。因此,准确预测DDI成为临床重要任务,有助于临床医生做出有效决策,制定合适的治疗方案。目前已有许多基于人工智能的模型用于DDI预测。而现有的研究方法较少关注DDI与靶标、酶等多模态数据之间的潜在相关性。此外,还没有考虑到多通道数据的跨通道互补性。

为了解决上述局限性,本文提出了一个多模态深度神经网络(MDNN)框架旨在针对DDI进行有效的多模态数据的联合表示学习。作者设计了一个基于药物知识图(DKG)和基于异质性特征(HF)的双通道框架来获取药物的多模态表征。然后,受到图神经网络学习图结构信息的启发,作者提出了GNN层,通过从DKG中提取结构信息和语义关系来学习药物表示。最后,设计了一个多模态融合神经层,通过探索药物多模态表征之间的互补关系来预测DDI。

2.模型介绍

MDNN模型的结构如上图所示,由两个主要通道组成:基于DKG的通道和基于HF的通道。基于DKG的通道利用图神经网络在构建的药物知识图上提取药物之间的拓扑结构信息和语义关系。基于HF的通道旨在从不同的模式中提取预测信息,以提高学习模型的性能。采用多模态融合神经层有效地辅助结构信息和异质性特征的联合表示学习,以探索多模态数据的交叉互补性。

2.1 基于DKG的通道

本文考虑了一种用于DDI预测的特殊知识图,称为药物知识图(DKG)

分别表示药物集和与药物关联的为实体的集合,

是药物和尾实体间关联的集合。

GNN层被用来捕获药物知识图中的药物拓扑结构和语义关系。药物知识图谱

的初始表示矩阵为:

分别是DKG中药物、关联、尾实体的数量;

分别是药物、关联、尾实体的初始特征。

对任意药物

,随机抽取其固定数量的邻居

,为将关联的语义信息纳入药物表征学习,定义

与尾实体

(通过关联

相连)之间的特征得分为:

分别是

在第

层GNN后的特征。

分别是权重矩阵和偏置,

表示element-wise乘积。

随后通过聚合函数获得

的邻域信息:

然后得到

基于DKG通道的表征:

其中

是一个激活函数,

表示将两个向量拼接。

2.2 基于HF的通道

在基于HF的通道中,使用异质性特征来计算药物相似性。在本文中,异质特征包括target特征、substructure特征和enzyme特征。每种特征对应一组描述符,因此药物可以用二进制特征向量表示,其每个维(1或0)表示对应描述符的存在或不存在。为了使药物节点表示更加密集,提高向量的精度,本文使用主成分分析方法(PCA)对特征进行压缩,降低稀疏性,并使用Jaccard相似性度量方法从特征向量中计算成对的药物相似度:

于是可得到靶标相似度矩阵

、子结构相似度矩阵

、酶相似度矩阵

。然后得到药物

基于三种相似度的特征

。最后将这三种向量拼接作为

的异构特征嵌入:

2.3 多模态神经融合层

基于DKG的通道和基于HF的通道提供互补的信息。为了更好地利用这两种途径的信息,作者在多模态神经融合层中考虑它们的一致性和互补性。将

基于DKG通道的特征

和基于HF通道的特征

拼接作为

的最终特征。

同样的可以得到

的最终特征

的特征向量拼接后过全连接层得到两个药物间的预测打分:

表示激活函数。

3.实验结果

作者使用多个多分类评估指标来评估MDNN及对比方法的预测性能。

结果表明,MDNN在真实数据集上的DDI预测性能最好。作者分析原因是该模型既探索了药物知识图中的药物拓扑嵌入表示,又探索了多模态数据的跨模态嵌入表示。此外,通过与其他先进方法的比较研究表明,MDNN获得了最稳定的性能,这可能是由于:(1)MDNN引入了GNN模型,利用药物知识图中的拓扑结构信息和语义关系; (2) MDNN利用多模态数据的交叉模态互补信息。

为了探究基于DKG和基于HF的通道如何改善所提出模型的性能,作者对以下MDNN变体进行了消融研究。MDNN_dkg只考虑拓扑结构和语义关系,从DKG中学习药物对的嵌入。MDNN_hf仅使用异质性特征探索药物对的跨模态嵌入。而且,由于MDNN_hf只考虑药物-药物对的多模态属性特征,因此在所有指标上的表现都比MDNN和MDNN_dkg差。下图显示了消融结果,验证了MDNN模型中每个通道的贡献,表明将邻域的拓扑表示与DKG和异构特征的语义关系相结合,有利于提高DDI的预测性能。从结果可以看出,MDNN在所有指标上都优于两种变体。

在本工作中,有三个重要参数,即邻域样本的大小

, GNN层数l和嵌入DKG的维数d。

作者改变邻居样本

的大小来探索MDNN的有效性,从下图可以看出,当

= 6时,MDNN的性能最好,当

过小时,模型不能完全捕获结构信息,而

过大则使模型更容易受到噪声的误导;通过从1到3改变GNN层l的值来研究GNN层的影响,从l = 1开始,MDNN在所有指标上的性能都在下降,因为较大的l会给模型带来大量的噪声,说明在DKG中编码每种药物的拓扑信息时,使用跳数过多的节点没有什么区别,实验结果表明,l = 1对于实际情况通常是理想的;此外,通过改变嵌入维度d的值从32到512来检验其影响。直观地说,通过适当大小的d可以从DKG中编码足够的药物和实体信息,从而提高性能,但当d过大时,模型会受到过拟合的影响。

作者还在两个不同的任务上检验模型,将所涉及的药物随机分成五个子集,其中四个作为训练药物集,其余一个作为测试药物集,以评估模型的有效性。对于任务A,作者以训练集中的DDI训练模型,然后对训练集药物与测试集药物之间的DDI进行预测。对于任务B, MDNN对测试集药物之间的DDI进行预测。

从下表中可以看出,MDNN在两个任务中的实验结果都优于其他方法。这有效地说明了无论是在已知药物还是新药之间,利用结构信息和异构特征提高了DDI的预测精度,为DDI的预测研究提供了强有力、可靠的支持。

4.总结

本文提出了一种新的用于药物-药物反应预测的MDNN模型。MDNN利用药物知识图上的图神经网络,有效地利用拓扑信息和语义关系。此外,多模态神经网络还利用了结构信息和异构特征的联合表示学习,有效地探索了多模态数据的跨模态互补性。实验结果表明,该模型优于传统的DDI预测模型。

021/0487.pdf

0 人点赞