编译 | 洪越
今天给大家介绍由厦门大学刘向荣教授团队发表在Bioinformatics上的文章,文章提出一个用于DDI预测的链接感知图注意网络,称为LaGAT。该模型能够基于不同的药物对在知识图谱中为药物实体产生不同的注意途径;作者在两个公开的DDI数据集上进行了实验,并可视化了模型生成的注意力路径。结果证明,LaGAT能够更好地捕捉语义关系,并能够基于知识图谱做出更具有可解释性的DDI预测。
1
研究背景
药物相互作用(DDI)是指当患者同时服用两种或多种药物时,药物的疗效可能增强或减弱,甚至可能出现副作用。DDI预测是药理学和临床应用中的一个极具挑战性的问题。随着大型生物医学数据库的日益可用,药物相关的大规模生物知识图谱与深度学习技术已被广泛用于DDI预测,比如图神经网络(GNN)和翻译嵌入(TransE)。然而,大型知识图谱不可避免地存在数据噪声问题,这限制了基于知识图谱模型的泛化性能和可解释性。最近的研究试图通过图注意力网络(GAT)来解决这个问题。然而,GAT只依赖于药物节点的拓扑结构为其邻居节点分配固定的注意力权重,而没有考虑不同药物对中药物节点所关注的邻居节点会发生变化。所以基于GAT的模型做出的预测依然在可解释性上存在不足,同时限制了自身的泛化性能。因此,该论文提出了一种链路感知的图注意力网络LaGAT,能够根据不同的药物对为药物实体生成动态的注意力权重,对不同类型的DDI进行端到端的预测,并且模型生成的注意力权重具有良好的可解释性。
2
模型与方法
作者提出的模型框架可以分解为三个部分: 子图采样模块、链路感知图注意层和分层聚合层,如图1所示。首先,子图采样模块从数据集中提取药物对,形成 DDI 矩阵。同时得到每种药物的 H-hop 邻居节点,并随机对每一Hop的邻居节点进行采样构成药物的子图。然后,链路感知注意层嵌入药物u,v子图中包含的所有节点并计算子图中每个节点的邻居节点的注意权重,使每个节点根据注意权重聚合其邻居节点的嵌入表示来对自身的嵌入表示进行更新。最后,分层聚集层连接药物节点每次更新的嵌入表示,得到药物节点的最终特征向量,并预测 DDI 的标签。
图1 LaGAT框架图
作者比较了GAT 层和LaGAT层的区别,来体现LaGAT层的优势。传统的GAT层使用节点本身的嵌入表示作为查询向量,结合相邻节点的嵌入表示来学习注意力权重。作者认为,这种策略虽然成功地使每个节点对其邻居分配不同的权值,但是它的局限性在于,只要节点的拓扑结构是确定的,它最终学习到的注意力权重就是确定的;而链路预测任务使用药物对作为监督信号,在不同的药物对中,每个节点需要注意的节点并不固定,药物子图中的注意路径应根据药物对而变化。LaGAT层则根据不同的药物对选择不同的药物节点的嵌入表示作为查询向量,来学习注意力权重。比如图1中,LaGAT 使用药物 v 作为查询向量来计算药物 u 子图中每个节点的注意力重量(浅红框) ,并使用药物 u 作为查询向量来计算药物 v 子图中每个节点的注意力重量(绿框)。文中以伪代码的形式展示了LaGAT层具体的计算方式,如图2所示。
图2 LaGAT层的计算实现
3
实验
作者使用两个广泛使用的数据集 (1)二分类 DDI: 使用KEGG -drug的数据构建 KG和DDI 矩阵,其中包含1,925个批准的药物和56,983个批准的相互作用。(2)多分类DDI: 使用 DrugBank提供的数据构建 KG 和DDI,其中包含映射到 DrugBank 标识符(ID)的1709种药物和涉及86种药理学关系的136351种药物对药物之间的关系。评估指标结果如表2所示。可以看出,即使没有使用最后的分层聚合层,作者的方法LaGAT-base依然优于基准方法。
为了进一步验证模型性能,作者在各个参数下比较了自己的方法与基准方法在都使用分层聚合层后的效果,如图3所示。可以看出,在不同超参数下,作者提出的方法都优于基准方法,并且和GAT以及GAT-const相比,LaGAT在链路预测任务上存在优势,侧面支持了作者的假设。
图3 消融实验
最后作者从测试集中挑选了一组典型案例,对模型生成的注意力权重进行了可视化,如图4所示。
对于每个药物节点,作者用粗体连接边来突出注意力权重排名前3的路径,用粉色节点表示两个药物的共同邻居节点,然后用节点大小来表示每个节点的注意力权重。对于Midazolam和Cyclosporine,LaGAT 分配的概率最高的 DDI 类型是“药物一的血清浓度会增加,当它与药物二结合时”。可以看到,模型将高注意力权重分配给两种药物共有的实体节点:酶节点“CYP 3A4”。研究表明,Cyclosporine在肠道和肝脏中由 CYP450 酶代谢,主要由 CYP 3A4 和 CYP 3A5 贡献,它会竞争性抑制人肝微粒体中的 CYP3A4 ,而Midazolam的生物转化是由具有高度可变活性 的 CYP 3A4 介导的,这支持了模型的预测。对于Midazolam和Amobarbital,LaGAT 分配的概率最高的 DDI 类型是“可能会增加不良反应的风险或严重程度”。可以看到,模型将高注意力权重分配给两种药物共有的实体节点:药物类别节点”精神疾病相关“和药物类别“GABA(A) 受体亚基 alpha-1”节点。研究表明,阿莫巴比妥(与所有巴比妥类药物一样)通过与 α 位点的 GABAA 受体结合起作用,且巴比妥酸盐能增强 GABA 对这种受体的作用,这支持了模型的预测。
值得注意的是, LaGAT为药物Midazolam在不同的DDI预测中生成了具有可解释性的不同的注意力路径,并且作者指出,如果没有使用LaGAT,模型虽然能正确预测Midazolam和Amobarbital的DDI类型,但无法正确预测Midazolam和Cyclosporine的DDI类型。这从侧面说明,LaGAT不仅有助于生成具有可解释性的注意力路径,还能提高模型的预测性能。
图4 LaGAT 产生的注意力路径。
5
总结
文章提出了一种基于链路感知的图注意网络,用于药物相互作用预测任务。它能够在不同的DDI中为同一药物实体产生不同的注意途径,为 KG 模型预测的结果提供可解释性。此外,案例研究的可视化结果表明,该注意力方法可以学习更准确的语义,这有利于模型预测不同类型的 DDI。同时文章作者也表示,今后将尝试利用药物的分子特征生成生成更好的初始嵌入表示进行特征融合,来解决冷启动问题。
参考资料
Yue Hong, Pengyu Luo, Shuting Jin, Xiangrong Liu, LaGAT: Link-aware Graph Attention Network for Drug-Drug Interaction Prediction, Bioinformatics, 2022;, btac682,
https://doi.org/10.1093/bioinformatics/btac682
代码
https://github.com/Azra3lzz/LaGAT