编译 | 曾全晨 审稿 | 王建民
今天为大家介绍的是来自John L. Kulp, III团队的一篇论文。基于片段的药物设计利用关于小化学片段如何以及以多大强度与蛋白质结合的数据,以构建新的药物分子。在过去的十年中,作者已经成功地在数十个临床前药物项目中使用了来自热力学的蒙特卡洛片段-蛋白结合模拟的片段数据。然而,由于模拟和设计工具的成本和复杂性,这种方法尚未为更广泛的研究社区所使用。作者开发了一个名为BMaps的网络应用程序,以大大简化的用户界面使基于片段的药物设计广泛可用。BMaps提供了对一个大型存储库(>550个)的蛋白质和数百个预计算片段地图、可药用热点和高质量水分布图的访问。用户还可以使用自己的结构或来自ProteinBank和AlphaFold DB的结构。BMaps在一个非常易于使用和自动化的网络应用程序中将传统工具与基于片段的设计相结合。
在过去的二十年中,基于片段的体外药物设计(FBDD)已经成为早期药物发现和引导优化项目中的高通量筛选(HTS)的一种替代方法。HTS涉及大规模筛选化合物库,但不足以覆盖化学空间中药物样区域的大部分。FBDD相比HTS和虚拟筛选(VS)方法具有许多优势。这些优势包括可靠地产生片段命中;对片段命中进行直接修改和优化,以开发具有有利性质的药物样化合物;较低的分子量;以及对化学空间的更大部分进行采样。过去25年中,特别是在学术界和工业研究项目中,体外蛋白质-配体模型技术的采用,尤其是基于片段的方法,稳步增长。在线调查显示,在过去的十年中,工业用户和非营利用户在FBDD实践中呈现出不断增长的趋势。然而,需要的专业知识以及支持体外方法的模拟和工具的成本一直是其限制因素。作者的目标是通过创新的基于网络的FBDD应用程序彻底改变这一现状。
化学片段是低分子量(150-300 Da)的化学成分,可以组合成较大的药物分子。它们通常在许多位点上具有低亲和力的结合,但具有高配体效能。通过研究这些片段在蛋白质表面的不同位点上的结合方式和位置,化学家可以为新靶标蛋白的药物可行性开发思路,识别蛋白质相互作用(PPI)的抑制位点。药物与其预期靶蛋白之外的蛋白质结合导致的非靶位点相互作用可能会引发毒性。毒性是临床试验中失败的主要原因之一。非预期的非靶位点相互作用也可以通过片段分析来研究和优化。FBDD在发现了四种已获批准的药物和超过40个临床试验候选药物方面做出了重要贡献。这些有前途的案例已经促使研究人员探索蛋白质-蛋白质和蛋白质-脱氧核糖核酸相互作用更具挑战性的方面。
当通过计算方法确定片段结合姿态时,一个关键需求是评估和排名这些姿态。通过相互作用能量或经验得分对片段姿态进行排名通常会导致准确性不佳,从而产生过高的假阳性预测百分比。这促使我们呢采用更准确和稳健的技术,如蒙特卡洛(GCMC)模拟。这种模拟提供了一种热力学的方法,通过表达为超过化学势的结合自由能来推导片段构象的统计分布。该算法通过玻尔兹曼分布作为超过化学势的函数,准确地预测了片段结合自由能。化学势模拟退火(SACP)技术将片段强制插入到蛋白质的所有结合位点中。然后,通过化学势的逐渐退火,将它们移除,以确定片段和/或水分子紧密结合的结合位点。因此,结合的GCMC-SACP技术提供了一种从第一原理出发的方法,用于生成由自由能度量排名的准确可靠的片段地图。GCMC-SACP技术在计算稳健的水分布图方面尤其有价值。通常用于预测结构化水分子的水分布图工具通常采用得分方法、基于网格的取样或分子动力学模拟方法,准确性较低。通过应用GCMC-SACP,作者开发了一种水分布图工具,可以发现多体水分子-大分子相互作用,并基于它们的自由能提供准确的预测和排名。
目前诸如LUDI、CCLD、MCSS、GANDI、PRO_Ligand、HOOK、UCSF DOCK、SEED、Skelgen、eHits、BREED、CrystalDock、Lea3D和FragFEATURE等各种基于片段的设计工具可用,它们在使用的片段类型和评分函数方面各不相同。为了更简单地使用片段技术,研究人员还开发了几种网络服务。这些服务可以分为基于几何的(例如HybridSim-VS、FragRep、e-LEA3D)、基于能量的(例如ACFIS、FragRep、FTMap)、基于网格的(例如FTMap)、基于人工智能(AI)的(例如DEEPScreen、DeepScreening、DeepFrag)和基于对接的(例如CHARMMing、Probis-CHARMMing、e-LEA3D)。尽管存在许多用于体外药物设计的开源和商业工具,但门槛可能包括使用的复杂性、受限制的访问和高成本,需要足够的存储和计算能力,或需要下载和配置工具。通过在一个单一的网络应用程序中集成和便利地使用各种所需的体外工具,可以克服这些障碍。
为了满足这些需求,作者开发了BMaps:一个综合的基于片段的网络应用程序,支持大型的模拟片段结合数据库,通过几何搜索算法寻找化合物修饰的最佳结合姿势,准确的水分子映射技术,以及使用SACP技术建模蛋白质-配体和蛋白质-水相互作用的高性能蒙特卡洛模拟器。该网络服务支持对对接、能量最小化、引物优化、片段映射、片段搜索、热点分析的计算,以及水结合图。BMaps允许用户在所选的结构和片段上进行片段/水模拟,然后将这些信息应用于新药引物的设计和优化。这个新工具将体外片段基药物设计技术直接引入化合物设计和评估过程中。
图 1
软件介绍
BMaps网络应用程序为一系列片段基药物设计(FBDD)活动提供了统一的平台,包括对目标、化合物和片段进行建模;评估和修改化合物;运行片段和水模拟;以及可视化模拟结果并将其应用于药物设计。示例工作流程见图1。
可视化和评估化合物结合
用户可以从预先计算的片段结合数据库中选择目标蛋白质,从PDB或AlphaFold导入结构,或者上传自己的结构。预先计算的库包括超过550个在治疗上相关的结构,这些结构经过手工优化并与片段模拟。这些准备好的结构都具有预先计算的可药性热点、水分子图以及100多个片段图。如果用户的目标尚未准备好,用户可以直接从PDB导入结构。在没有3D晶体结构的情况下,可以通过使用其UniProt ID从基于AI的预测蛋白质数据库AlphaFold导入预测结构。当用户需要使用专有结构时,可以以PDB或CIF格式上传。对于所有导入的结构,通过AmberTools分配Amber力场参数和AM1-BCC电荷。这些结构最初缺少片段结合数据,因此用户需要运行片段或水模拟,以获取关于热点、片段等信息。
在导入化合物后,用户可以将其对接到目标蛋白质上,指定围绕晶体配体、热点或任选原子的网格框。默认情况下,网格框的大小会根据被对接化合物进行优化。使用Autodock Vina进行对接。完成后,可以可视化单个结合位点以及其能量值。计算配体结合能在指导片段设计、优化和结合亲和性预测方面具有重要意义。因此,与蛋白质和化合物的相互作用能计算可以通过单击一键进行。程序使用OpenMM计算相互作用能。能量计算可以帮助用户观察片段设计和修改过程中所做更改的影响。能量窗口分别显示相互作用评分(氢键和范德华能贡献的组合)、脱溶代价(ΔΔGs)、由于受到结合和未结合构象之间内部能量变化的变应力Δ以及其他静电贡献。在片段修改之后,可以通过比较能量值和其他物理化学性质的前后变化,更好地判断选择合适的修改。
将片段结合数据应用于化合物设计
热点(支持多样化化学基团强结合的生物分子结构上的位置)通过对模拟的片段结合数据应用聚类分析来得出。聚类分析的三个原则是(i)多样化的化学基团,(ii)强结合,和(iii)排除水分子(不与水分子强竞争)。GCMC-SACP片段地图准确地预测了热点和可结合位点的位置,这些位点控制着各种蛋白质-配体、蛋白质-蛋白质和蛋白质-脱氧核糖核酸/核糖核酸相互作用。了解水分子的空间分布和热力学性质可以为配体结合提供有价值的见解,并可以激发通过取代弱结合的水分子或避免紧密结合的水分子来增加化合物的亲和力变化。GCMC模拟也以准确预测多体水分子相互作用而闻名,这是其他水分子映射技术的局限性。通过半定量的氢键可视化,可以根据其强度区分氢键。模拟水分子以指示脱溶化成本的方式突出显示。BMaps准备好的结构上生成的所有水分子地图均在没有晶体配体的情况下运行。然而,也可以在放置化合物的情况下运行新的水模拟。
片段数据包括许多片段构象分布在蛋白质表面周围。在化合物设计过程中,可以搜索这些片段构象,找到适合用于替代化合物的高亲和力构象。片段搜索结果以表格形式显示,包括结合分数(结合自由能度量,包括构型熵和脱溶成本)和其他性质。片段结合构象与化合物或其一部分重叠,清晰地展示片段基于修改的结合。通过“Grow with Distribution”可以显示了模拟姿势的云,用户可以从具有所需过量化学势值的分布中选择一个构象。当用户选择将片段合并到化合物中时,组合会自动完成。
生成新的片段结合数据
BMaps允许用户运行新的片段模拟,以便他们可以将片段结合数据的见解应用于他们感兴趣的目标。首先,蛋白质系统通过指定要包括在模拟中的结构特征(链、离子、辅因子,以及对于水图)进行准备。然后选择片段,并提交模拟作业。完成后,可以将结构加载到设计环境中,提供热点、水图和片段图的可视化。决定要运行哪些片段取决于目标是识别热点、寻找通用的片段扩展机会,还是探索特定片段扩展机会的结合位点。为了支持广泛的用途,BMaps将多个文献和工业界的片段集合整合到一个包含4000多个化学多样性片段和其他小分子的数据库中。这些集合包括BMaps自己的片段、MiniFrags和Rings in Drugs文献集,以及Maybridge片段和其他库的子集。用户可以通过2D草图绘制或导入SDF文件来配置用户自定义片段。也可以自动将生物活性分子或感兴趣的化合物分解为生成新的较小片段。感兴趣的片段可以分组,以创建用于片段搜索、修改/优化和运行模拟的自定义片段集合,使药物化学家能够根据所需的化学基团和自定义特征组织他们的片段。
参考资料
Bryan, D. R., Kulp Jr, J. L., Mahapatra, M. K., Bryan, R. L., Viswanathan, U., Carlisle, M. N., ... & Kulp III, J. L. (2023). BMaps: A Web Application for Fragment-Based Drug Design and Compound Binding Evaluation. Journal of Chemical Information and Modeling, 63(14), 4229-4236.