一
论文题目:
FusionDTA: attention-based feature polymerizer and knowledge distillation for drug-target binding affinity prediction 论文摘要:
药物-靶点亲和力(DTA)的预测在药物发现中起着越来越重要的作用。目前,许多预测方法主要关注药物和蛋白质的特征编码,而忽略了特征聚合的重要性。然而,日益复杂的编码网络导致了隐式信息的丢失和模型尺寸的过大。文章提出了一种基于深度学习的方法,即FusionDTA。针对隐式信息丢失的问题,提出了一种新的多头线性注意机制来替代粗糙池化方法。这允许FusionDTA基于注意力权重聚集全局信息,而不是像max-pooling那样选择最大的一个。为了解决参数冗余的问题,将可学习信息从教师模型传递到学生模型中,并将知识精馏应用到信息融合模型中。结果表明,在所有的评估指标上,FusionDTA的性能都优于现有的测试域模型。在Davis和KIBA数据集上,文章得到了一致性指数(CI)指数分别为0.913和0.906,而之前的先进模型的一致性指数分别为0.893和0.891。文章的模型具有优越的性能,提高了药物-靶点相互作用(DTI)预测的效果。
论文链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab506/6470967 Github链接:
https://github.com/yuanweining/FusionDTA
二
论文题目:
AlphaFold2-aware protein–DNA binding site prediction using graph transformer 论文摘要:
蛋白质-DNA相互作用在生物系统中起着至关重要的作用,识别蛋白质-DNA结合位点是从机制上理解各种生物活性(如转录和修复)和设计新药的第一步。如何准确地从蛋白质序列中识别DNA结合残基仍然是一个具有挑战性的任务。目前,大多数基于序列的方法只考虑序列邻域的上下文特征,仅限于捕捉空间信息。基于AlphaFold2最近在蛋白质结构预测方面的突破,作者提出了一种基于AlphaFold2预测的结构模型来识别DNA结合残基的预测模型GraphSite。在这里,作者将结合位点预测问题转化为一个图节点分类问题,并采用基于transformer的变体模型来考虑蛋白质的结构信息。通过利用预测的蛋白质结构和图形transformer,GraphSite提高了最新的基于序列和基于结构的方法。该算法在181个蛋白质的独立测试集上得到了进一步的验证,其中GraphSite在精确召回曲线下的面积和Matthews相关系数上分别比最新的基于结构的方法提高了16.4%和11.2%。
论文链接:
https://doi.org/10.1093/bib/bbab564 Github:
https://github.com/biomed-AI/GraphSite
三
论文题目:
HCRNet: high-throughput circRNA-binding event identification from CLIP-seq data using deep temporal convolutional network 论文摘要:
识别环状RNA(CircRNA)和RNA结合蛋白(RBPs)之间的全基因组结合事件可以极大地促进我们对环状RNA内功能机制的理解。由于交联免疫沉淀测序技术的发展,积累了大量全基因组circRNA结合事件数据,为设计高性能计算模型以区分RBP相互作用位点,从而解释circRNA的生物学意义提供了机会。不幸的是,仍然没有足够灵活的计算模型来适应来自不同数据尺度和不同程度特征表示的循环。文章开发了HCRNet,一种用于识别circRNA RBP结合事件的新型端到端框架。为了捕捉层次关系,多源生物信息被融合来表示CircRNA,包括各种自然语言序列特征。此外,还开发了一个包含全局期望池的深时间卷积网络,以穷尽的方式利用潜在的核苷酸依赖性。文章在37个circRNA数据集和31个线性RNA数据集上对HCRNet进行了基准测试,以证明提出的方法的有效性。为了进一步评估模型的稳健性,文章在包含740个CircRNA的完整数据集上进行了HCRNet。结果表明,HCRNet优于现有的方法。
论文链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac027/6533504 Github链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac027/6533504
四
论文题目:
Heterogeneous cryo-EM projection image classification using a two-stage spectral clustering based on novel distance measures 论文摘要:
单粒子冷冻电子显微术(cryo-EM)已成为结构生物学领域确定生物大分子三维结构的主流技术之一。异质冷冻电镜投影图像分类是发现生物大分子在不同功能状态下构象异质性的有效方法。然而,由于投影图像的低信噪比,异类cryo-EM投影图像的分类是一项非常具有挑战性的任务。本文设计了两种新的投影图像之间的距离度量,综合了公共线、像素强度和类平均的可靠性,并提出了一种基于这两种距离度量的两阶段谱聚类算法,用于异类cryo-EM投影图像分类。在第一阶段,利用融合投影图像公共线和像素强度的新距离度量,通过谱聚类获得初步分类结果。在第二阶段,使用另一种新的距离度量,该距离度量集成了第一种新的距离度量和从每组投影图像生成的类别平均值,以通过谱聚类获得最终的分类结果。将所提出的两阶段谱聚类算法应用于模拟和真实的cryo-EM数据集进行异质重建。结果表明,这两种新的距离度量可以用来提高谱聚类的分类性能,并且使用提出的两阶段谱聚类算法可以获得比RELION和XMIPP更高的分类和重建精度。
论文链接:
https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbac032/6543485