DRUGAI
今天为大家介绍一篇近期发表在Advanced Science上的论文:AI-Powered Mining of Highly Customized and Superior ESIPT-Based Fluorescent Probes。论文通讯作者为中南大学董界副教授和曾文彬教授,论文第一作者为硕士研究生黄文智。该论文将机器学习建模预测、量化计算和实验相结合来探索理想的ESIPT荧光分子。作者提出了一种利用人工智能开发多级预测系统的新方法,该系统有助于快速有效地探索可定制的ESIPT荧光分子。通过这种新颖高效的方法,作者成功从57万个 化合物中筛选了700多种暂未报导的ESIPT分子,这项工作有望为快速挖掘具备不同骨架类型和理想性质的ESIPT分子带来新的范式。
背景
ESIPT(激发态内质子转移)荧光团在分子探针、发光材料以及荧光传感器领域具有重要应用前景,是发光材料研究的热点之一。与其他荧光机制相比,ESIPT荧光团表现出强大的固态荧光、大斯托克斯位移和卓越的环境敏感性,使其成为荧光传感器和生物大分子成像的宝贵工具。然而,现有的ESIPT荧光团开发主要依赖于对传统荧光团的修饰,并且由于ESIPT过程易受环境因素影响,实验预期与设计之间仍存在较大差距。随着人工智能算法与大数据时代的到来,作者尝试利用人工智能的方法提高ESIPT荧光探针的开发效率,以开发出多样化的ESIPT荧光团来满足不同应用环境的需求(图1)。
图1 利用人工智能寻找有高定制化的ESIPT分子示意图,然后对候选ESIPT分子进行定量计算和湿法实验验证。
这项研究中,作者首先构建了首个高质量ESIPT荧光分子数据集,并且结合多种机器学习算法和分子表征构建了多级预测系统。该系统通过逐步分析预测传统小分子与荧光分子、再到ESIPT分子之间的差异;通过构建新的能量势垒预测模型进一步进行精细化筛选,最终筛选出理想ESIPT荧光团。此外,作者利用SHAP方法揭示影响ESIPT行为的关键子结构和分子性质,其中对于ESIPT效应的重要描述符与结构片段见图2。SHAP图可以解释各个特征对于模型的贡献,通过模型解释的分析,作者发现了一系列对ESIPT效应有重要影响的结构信息。
图2 多级预测模型的模型解释与分析。A)使用MACCS-RF的E-CM模型的前20个特征的SHAP值。B)使用MACCS-RF的E-FL模型的前20个特征的SHAP值。C)使用2D-RF的E-CM模型的前20个特征的SHAP值。D)使用2D-RF的E-FL模型的前20个特征的SHAP值。E)Veen图展示了E-CM和E-FL在MACCS-RF中重叠的前20个重要特征。F)Veen图展示了E-CM和E-FL在2D-RF中重叠的前20个重要特征。G)可视化部分重要MACCS指纹。H)在E-FL模型中利用MACCS-RF的组合对HBT进行SHAP分析。I)在E-FL模型中利用MACCS-RF的组合对5,6-二氢苯并[c]吡啶醇进行SHAP分析。
为了确保开发的荧光探针在能发生ESIPT效应的同时也能满足不同应用场景的需求,作者制定了三种策略,从毒性与安全性、骨架结构创新型以及药代动力学特性综合指导可定制ESIPT荧光团的开发,并成功从57万个化合物中筛选出700多个新型ESIPT分子以满足不同应用环境的需求。图3A展示了各个策略中打分Top100的化合物的基本理化性质。
在毒性与药代动力学特性策略中得到的分子与四种经典荧光团相比都表现出较低毒性与良好的药代动力学特性。在结构多样性策略中得到的分子的多样性评分也同样有良好的表现。
此外,作者还在实际应用中测试了多级预测系统的性能。该多级预测系统预测了团队中之前报道的且未经过模型训练的10个ESIPT分子(图3F),回收率高达100%。最终,通过比较溶解度以及可合成性等因素,作者选择对FL-1、FL-2和FL-3作为优选分子进行进一步验证。
图3 候选分子性质分析结果。A)展示各个策略中排名Top100个分子的基本理化性质的分布。B)四种经典ESIPT荧光团。C)毒性和安全策略中排名Top100的分子与4种经典荧光团的安全性评分。D)收集的ESIPT阳性样本与三种评估策略得到的分子的多样性得分。E)药代动力学特性中排名Top100的分子与4种经典荧光团的药动学评分。F)10个额外验证的ESIPT荧光分子。G)候选ESIPT分子FL-1、FL-2和FL-3。H-J)FL-1、FL-2和FL-3在收集到的922个ESIPT分子集合中的LogS、LogD和可合成性分布。
通过势能曲线可以发现(图4A),FL-1、FL-2和FL-3的能垒表明它们都能迅速的发生ESIPT效应。随后作者选择合成了FL-3,在不同溶剂中可以观察到了ESIPT效应特有的烯醇式发射与酮式发射,证明了FL-3可以产生ESIPT效应,并且在后续的细胞毒性与溶血实验中,FL-3都有出色的表现,这与模型预测结果一致,证明了该系统在发现有理想的ESIPT荧光团方面的有效性和可靠性。
图4 候选分子的量化与实验验证结果。A-C)FL-1、FL-2和FL-3的势能曲线。D-F)FL-1、FL-2和FL-3在S1态的HOMO与LUMO电子云密度分布。G) FL-1、FL-2和FL-3的ESIPT过程示意图。H)FL-3在不同溶剂中的吸收光谱。I)FL-3在不同溶剂中的发射光谱。J)不同浓度FL-3对红细胞溶血率的影响。K)A549细胞与FL-3孵育后的细胞毒性评价。
结论
在本研究中,作者构建了首个ESIPT荧光分子数据集,以此进一步利用多种机器学习算法和分子表征构建了一个多级预测系统,实现了从大量化合物中逐步区分常规分子、荧光分子、再到ESIPT分子。随后作者基于SHAP的方法揭示了有助于ESIPT的关键结构特征。此外,作者提出了三种策略,以确保筛选出来的候选分子能进行ESIPT的同时能够保持良好的安全性、药代动力学特性和结构的新颖性以满足不同应用场景的需求。通过这些策略,作者成功从57万个化合物中筛选出700多个暂未被报道过的ESIPT分子,并通过定量计算和实验成功验证了最佳分子的ESIPT过程和生物安全性。这项研究展示了人工智能在荧光探针开发中的巨大潜力,可为未来开发新型ESIPT荧光探针提供新范式。
参考资料
Huang, W., Huang, S., Fang, Y., Zhu, T., Chu, F., Liu, Q., Yu, K., Chen, F., Dong, J. and Zeng, W., AI-Powered Mining of Highly Customized and Superior ESIPT-Based Fluorescent Probes. Advanced science (Weinheim, Baden-Wurttemberg, Germany), p.e2405596.