2024年9月,查尔斯河实验室CADD领域高级研究负责人David E. Clark等人在Drug Discovery Today上发表综述Caught between a ROCK and a hard place: current challenges in structure-based drug design。
在这篇综述中,作者以Rho相关蛋白激酶(ROCK)以及公共域结构和数据为例,说明了计算机辅助药物设计(CADD)科学家每天在工作中面临的一些挑战。
作者希望这将有助于避免对CADD所能完成的工作产生不切实际的期望,并让业界了解仍然面临的困难和问题。
在药物发现领域,尤其是基于结构的药物设计(Structure-Based Drug Design, SBDD)中,尽管我们拥有了比以往任何时候都更强大的工具和技术,但面临的挑战依然严峻。以下是对SBDD中面临的七大挑战的深入剖析,旨在全面揭示该领域的复杂性和不确定性。
挑战1:原材料
在2024年6月,蛋白质数据库(PDB)收录了37个人类ROCK1或ROCK2激酶的X射线结构,主要来自学术研究及工业研究,以ROCK1为主。尽管多数结构分辨率符合药物设计标准,但有四个低于推荐的2.5 Å,增加了建模的主观性和原子位置的不确定性。
ROCK激酶的结构确定较其他激酶更具挑战,导致部分研究采用替代蛋白。低分辨率还影响水分子的辨识,但可通过溶剂映射程序如WaterMap等辅助分析,部分解释结构与活性关系。此外,晶体生产中的高配体浓度可能与生理条件不符,影响对靶点构象和配体占位的理解。因此,建模人员需合理管理实验数据带来的期望,认识分辨率结构的局限,并与计算化学和晶体学领域紧密合作,以正确解读结构信息。总之,跨学科合作对于准确评估和利用这些结构数据至关重要。
图1 Holo'形式的蛋白质数据库(PDB)结构5WNE
挑战2:蛋白质的低聚状态
处理ROCK激酶的挑战之一在于其低聚物状态,特别是N端区域对催化活性的影响。删除N端导致ROCK主要以无活性的单体形式存在,而包含N端的较长构建体则形成有催化能力的二聚体。ROCK的二聚体界面包括N端的“带帽螺旋区域折叠”和C端的高度保守疏水片段,后者对激酶激活至关重要。二聚体的组装稳定了具有催化能力的激酶构象,显示二聚体界面与催化口袋间存在显著串扰。
通过MD模拟比较了ROCK1的二聚体和单体形式的动态行为,发现单体N端部分迅速展开,灵活性增强,影响了激酶结构域的其他部分。特别是,单体中的αC-螺旋和P-环段波动性更高。对P环构象空间的分析显示,单体和二聚体之间存在显著差异。使用dPCA分析进一步证实了二聚化和单体状态在构象平衡上的显著差异,单体表现出更高的灵活性。
这些结果表明,精确建模ROCK必须考虑其二聚体性质。此外,CADD科学家与实验人员的紧密合作对于确保硅学与生物实验参数匹配,从而公平比较两组实验结果至关重要。
图2 对ROCK1二聚体和单体形式的MD模拟进行分析
挑战3:蛋白质的灵活性
为应对蛋白质灵活性,科学家们提出了多种方法。随着GPU计算、MD代码并行化及深度学习模型的发展,模拟方法变得更为实用。
我们广泛利用MD模拟来探究ROCK蛋白的灵活性,但长时间尺度模拟可能产生非本地结构伪影,受力场偏差影响。尽管如此,它们仍提供了关键结构信息,有助于制定SBDD规则。在模拟过程中,两种ROCK异构体均展现出高度灵活性,这与其特殊结构特征相关。
为更好地评估ROCK的动态灵活性,我们将单次MD复制时间延长至3µs。结果显示,二聚体对蛋白质稳定有积极影响,而较短时间的MD模拟可能无法准确捕捉目标蛋白质的动态。此外,总体RMSD指标可能不适合监测特定蛋白质区域内的微妙结构重排,因此我们使用雷达图和dPCA分析来评估P环构象空间的时间演变。
长时间尺度模拟揭示了ROCK蛋白的高度结构灵活性,特别是其特殊的结构松弛时间。建模人员在合理化SAR和设计新化合物时,必须充分考虑这种结构灵活性。X射线结构提供的“快照”可能具有误导性,而MD模拟则是对此的必要补充,尽管将这种复杂性融入分子设计仍具挑战性。
图3 ROCK1的长时间MD模拟分析
挑战4:配体的制备
在药物发现项目的建模初期,准确制备小分子化合物的三维结构至关重要,包括立体化学、质子化状态及同分异构体的考虑。然而,这并非总是易事,尤其是对于多质子和同分异构体分子,其pKa值的预测充满挑战。
以ROCK抑制剂AR-12141和AR-12432为例,它们的质子化状态受pKa影响,而pKa的准确预测并非总是可靠。自动工具如LigPrep虽能提供帮助,但用户的手动检查和验证至关重要,以防计算错误导致无效结果。在某些情况下,如配体AR-12141,同时考虑质子化和中性形式可能更为明智,因为两者在生理pH下均可能大量存在。
此外,共晶体抑制剂的例子也强调了仔细审查对接输入的重要性。自动配体制备工具可能未准确预测某些基团的质子化状态,从而影响对接结果和SAR的合理化。因此,应用不同的pKa预测工具和使用多种配体构象可能提供一种更全面的评估方法。
图4 仔细审查输入配体结构对于产生可靠的结合假说至关重要
总之,即使是为对接准备配体,也可能需要进行额外的研究,并且这些研究不一定总是有结论的。在虚拟筛选项目中,由于化合物数量庞大,人工检查质子化和同分异构状态变得不切实际。在这种情况下,建模人员可以通过指定一个适当的pH值范围来尝试涵盖各种可能性,但这可能导致待对接结构数量大幅增加,并可能引入假阳性结果。因此,在处理专有化学型或更具挑战性的分子时,需要格外谨慎。
挑战5:对接与评分
在药物发现中,对接和评分是确定潜在合成靶标优先次序、合理化新SAR的关键工具。然而,这些工具的输出结果需审慎使用,结合人类判断和经验。
以ROCK抑制剂为例,尽管对接能高精度再现晶体学姿势,但Glide XP评分与生物活性相关性不高,甚至存在反相关性。这表明标准评分方案无法捕捉一般SAR趋势,对确定拟合成配体优先顺序作用有限。
图5 对接和其他重新定位技术在诱饵或已知非活性衍生物中检索已知活性物质的能力
为评估对接在区分活性化合物和非活性化合物中的能力,我们进行了实验。结果表明,评分函数更适合识别结构不同的化合物中的ROCK特异配体,而非判断微小结构变化对亲和力的影响。不同蛋白质结构间的对接性能存在显著差异,选择合适的蛋白质结构对提高命中率至关重要。
总之,对接模拟可有效指导苗头化合物识别,但需评估对接预测的稳健性。广泛的分析无法针对缺乏实验数据或活性测量数据集的靶点进行。为靶点识别筛选量身定做的评分方案可能不适用于靶点到先导或先导优化阶段。目前对接和评分方法的局限性推动了更精确、计算要求更高的评分方法的发展,如基于自由能扰动的评分方法。
挑战6:自由能扰动计算
自由能扰动(FEP)特别适用于先导化合物识别和优化阶段,通过评估结构类似物之间的相对结合自由能差来优化药理特性。
在ROCK抑制剂的研究中,我们应用了FEP计算来估算配体的结合能。初始的FEP 运行未能提供实验结合自由能和计算结合自由能之间的显著相关性。为了提高FEP 的性能,我们重新分配了部分电荷,并延长了模拟时间。这些改进显著减少了预测误差,但总体RMSE值仍高于1 kcal/mol的“黄金标准”阈值。
我们的研究还表明,特定的模拟参数和蛋白质目标的结构特征对FEP结果有重大影响。此外,对于某些化学系列,SAR特性可能不同甚至相反,这需要在FEP计算中进行特殊考虑。
图6 在ROCK1上进行的FEP计算
总之,ROCK的研究强调了遵循为自由能计算定义的经验性“良好实践”的必要性。尽管存在挑战,但我们的经验表明,仔细而全面的SAR评估对于确定一组能够在FEP计算中得到可靠处理和评估的化合物至关重要。在进行FEP计算时,应考虑蛋白质结构的质量、配体部分电荷和MD方案等多个变量,以确保结果的准确性。
挑战7:选择性合理化与预测
在激酶药物发现中,常利用专业面板评估化合物对多种激酶的活性,以期理解并优化选择性。然而,即使对于高度相似的激酶,其选择性也难以仅通过结合位点相互作用来解释。例如,化合物A-11对ROCK2的选择性远高于ROCK1,但难以从结构上直接阐释这种差异。
图7 异构体选择性的计算机合理化可能具有挑战性
建模者通常首先考虑结合位点的不同,但选择性可能更多源于蛋白质整体动力学的差异,这难以确证且不易转化为设计策略。尽管活性位点残基差异大的激酶选择性理论上更易合理化,但实际情况往往复杂。高质量的非目标激酶结构虽有助益,但除非与共晶体化合物结合,否则作用有限。
此外,若选择性由复杂动态效应驱动,如诱导拟合或配体水合壳重组,则高通量计算工具难以准确预测。因此,尽管有理论和工具支持,激酶选择性的合理化和预测仍面临重大挑战。
结语
SBDD领域虽然取得了显著的进展但仍面临诸多挑战。从蛋白质结构数据的质量和分辨率、蛋白质的低聚状态和灵活性、配体的制备、对接与评分、自由能扰动计算到选择性的合理化与预测,每一个环节都需要精确的方法和细致的实验验证。
未来随着计算能力的提升和新方法的开发,这些挑战有望逐步得到解决,从而推动SBDD领域的进一步发展。通过深入理解和应对这些挑战,药物设计师们将能够更准确地预测和设计具有高效性和选择性的药物分子,为人类健康事业做出更大的贡献。
参考资料:
https://doi.org/10.1016/j.drudis.2024.104106
--------- End ---------