[JCIM | 论文简读] 图神经网络预测亲核性

2022-12-29 16:54:39 浏览数 (1)

作者 | 王宇哲 编辑 | 龙文韬

论文题目

Nucleophilicity Prediction Using Graph Neural Networks

论文摘要

在有机化学中,化学反应速率与试剂亲核性之间的定量描述较为重要。在这个方面,Mayr等人提出了相关公式并构建了反应性数据库。不过,Mayr的亲核性参数N往往需要进行化学实验测定。近年来,人们基于机器学习模型来实现数据驱动的亲核性参数N预测。除了密度泛函理论计算的电子描述符外,大多数情况下使用一组人为预定义的结构描述符作为输入。然而,这可能会导致亲核试剂结构信息的表示受到描述符定义偏好的影响,从而产生偏差。与传统的机器学习算法相比,图神经网络可以很自然地考虑分子的结构信息。我们提出了一个基于SchNet的GNN模型,只以分子构象和溶剂类型为输入。该模型对894个数据点进行10倍交叉验证,取得了与之前基准研究相当的性能。为了提高模型对分子中电子信息的捕获能力,然后通过图的全局特征将密度泛函理论计算的部分参数纳入模型,大大提高了预测精度。这些结果表明,结构信息和电子信息对亲核性参数N的预测都很重要,GNN可以更有效地整合这两种信息。

论文链接

https://pubs.acs.org/doi/10.1021/acs.jcim.2c00696

0 人点赞