Nat. Commun.|化学空间对接使基于结构的大规模虚拟筛选能够发现ROCK1激酶抑制剂

2022-11-28 18:05:29 浏览数 (1)

编辑 | 侯琳琳 审稿 | 程志祥

今天给大家带来的是Paul Beroza、James J. Crawford 于2022年10月发表在nature communications上的《Chemical space docking enables large-scale structure-based virtual screening to discover ROCK1 kinase inhibitors》。作者提出了一种结合了两个优点的虚拟筛选方法(1)它避免了对完整的库进行枚举(2)利用蛋白质结构信息,通过分子对接来评价产生的分子。作者应用这种方法从近10亿种商业可用化合物中鉴定ROCK1的抑制剂。在购买的69种化合物中,27种(39%)的Ki<10μM(Ki是抑制常数,值越小抑制强度越大)。这篇论文的对接方法比传统的对接方法快好几个数量级。

介绍

虚拟筛选的目的是用计算的方法搜索潜在有机分子空间,以识别虚拟“命中”,这些虚拟“命中”可以在实验室中获得和测试,以评估它们在所需靶标上的活性。分子口袋是一种常见的计算方法,它被广泛应用于药物发现。分子口袋利用靶标蛋白质的三维结构,将小分子放进它的结合位点上。然而,小分子和蛋白质的分子口袋对接过程中存在固有的计算复杂性:评估每个小分子需要考虑它的各种低能量三维构象,每个构象都有一个不同的三维几何结构。此外,更大的筛选库应该提高识别的命中的数量和质量,从而促进下游药物发现的成功。因此,化合物库越来越大。最近的对接活动达到了10亿化合物的里程碑,但是这些成就仅仅依赖于大量的计算资源。

高通量对接的发展以及按需合成的分子的可获得性导致了组合分子数量的爆炸。一些组合空间甚至包含1026个分子。在目前的硬件限制下,对如此大的组合空间的枚举都是不可能的。因此潜在的产物只能存储为构建块(可以简单理解为分子片段)和允许动态生成化合物的连接规则。特征树算法是探索这些大型化学空间的一种方法。该算法将查询分子与所有构建块进行比较,然后将最好的构建块与互补的构建块根据化学规则连接起来,以生成新的分子。该方法已多次成功地应用于超大型化学空间的虚拟筛选。

第一个以类似的组合方式探索三维化学空间而不使用暴力列举的方法是FlexNovo。它将化学片段放置在活性部位,并通过将最有希望的候选片段与其他片段连接来迭代地扩展它们。然而,所探索的化学空间是基于现有分子的裂解和重组,而没有考虑反应规则,这会导致部分片断组合并不能实际参与有效的化学反应。通过将基于结构的片段评估与化学空间的反应规则相结合,可以探索以前局限于2D搜索方法的更大的化学空间。作者提出化学空间对接这一策略,该策略利用了探索大型化学空间和容易获得的已识别命中的协同作用。

结果

通过对接选择构建块

双组分化学空间的构建块片段(一个构建块可能具有参与不同反应的部分,从而产生不止一个构建块片段)与Flexx对接应用对接到具有药效团限制的2ETR的结合部位(见方法)。每个片段最多生成10个对接姿势,总共产生129,125个姿势。使用HYDE评分函数对这些姿势进行评估,得分最高的50,000个姿势被导入并在SeeSAR中进行检查,以选择最佳的500个独特的构建块片段和相关姿势。

具有代表性的片段姿势如图1所示。方向和反应载体跨越结合部位,并通过列举的完整组合产物很好地覆盖其体积。

图一:被选择的开始片段姿势的对接姿势。

扩充库和筛选产物

遵循两组分化学反应的化学规则,选定的500个对接片段中的每一个都被用作产物的完整库枚举的起点。由此产生的500个库总共产生了5,236,824种产物。500个库中的每个库都是使用之前计算的片段姿势作为模板与FlexX对接的。对于每个产物,最多生成 5个对接姿势,最终得到23,305,389个完整虚拟产物的对接姿势。随后使用HYDE算法对这些姿势进行评分,在此步骤中的重新平衡、冲突消除和分数优化会筛选掉超过一半的姿势,总共10,391,986个姿势用于进一步评估和过滤。

得分最高的50,000个姿势被挑选出来,其中每个分子(大约33,000个虚拟产品)的最佳姿势被选择用于进一步分析。用Chemalot软件包进行应变能过滤。移除了内部应变能为5千卡/摩尔的对接姿势,分子数量减少到5940个。为了证实FlexX的对接结果,作者使用FRED对接程序将其余的5940重新对接到ROCK1结构。此外,为了增加所选化合物的化学多样性,作者使用k-Means聚类对5940个化合物进行了k-Means聚类,产生了500个簇。从每一簇化合物中,选择具有最佳FRED对接分数的簇成员进行进一步评估。

对500个簇的代表进行了两个定性筛选:刷掉具有过度灵活性的化合物和含有大疏水基团的化合物。在剩下的化合物中,通过目测选择了最后一组77种化合物,并从Enamine(www.enamine.net)订购。在这些样本中,有69个是实物样本。

活性分子的分析

在获得的分子中,27个分子的KI值低于10μM,对应的命中率为39%。最有效的化合物是38 nm,有13个化合物(19%)具有亚微摩尔活性。已鉴定的许多活性分子在结构上与已知的ROCK1活性相似,这表明作者的方法可以提供通过传统筛选和药物化学发现的结果。

图2显示了导致补充表1中所示活性分子的初始片段命中。两个苯基吡唑片段显然不仅产生了最多数量的活性物质,而且产生了最有效的活性物质。除了这两个起始片段外,其他片段显示出有趣的结构多样性,它们能够有效地与激酶铰链区相互作用,同时最佳地定位反应部分,使其在完整产物对接后在结合部位的其他地方具有有利的相互作用。

图二:初始片段命中。

根据其铰链结合基序将活性化合物分为四类:吡唑类、内酰胺/吡啶酮类、氮杂环酮类和吲哚类。这四个基团中的每一个都由至少三个活性分子组成。值得注意的是,用于对接计算的结构中的配体包含一个吡啶铰链结合基序,而该基序在鉴定的活性分子中不存在。图3显示了四种化学类型中每一种最有效的活性分子的结合姿势。

图三:确定的四种化学类型中最活跃的分子的对接姿势。

用X射线晶体学确定对接姿态

为了便于进一步验证该方法并确认假设的结合模式,作者获得了ROCK1与化合物1和化合物22的共晶结构,化合物1是虚拟筛选中发现的最有效的抑制剂,化合物22的结构被认为是唯一的。这些晶体在不对称单元中含有ROCK1激酶域的四个单体,其中链A、B和C相对定义良好,而链D的第四个拷贝排序很差,不能用于分析。聚焦于每个结构中的链A实例,得到的电子密度显示了每个配体的清晰的结合模式(图4A和图5A)。图4B和图5B中展示了实验蛋白质-配体复合体与在虚拟筛选中获得的对接姿势之间的比较。

图四:化合物1的X射线结构与其对接姿势的比较。a. X射线结构:精炼的2Fo-Fc电子密度在配体附近以1sigma等高线描绘。b. 对接姿势(浅绿色)和X射线构象(深绿色)的叠加。

图五:化合物22的X射线结构与其对接姿势的比较。

讨论

对接反应构建块片段并选择那些最有希望的片段,然后实例化与它们相关联的子库,在该示例中提供了对基于枚举库的当前对接策略的高效且非常成功的替代。因此,作者的验证研究打开了基于结构的搜索的大门,寻找比以前大得多的化学空间。不断增加的基于化学反应的化学空间包含的数字超过了可以考虑对接完全列举的库的许多数量级。即使是创造产品的计算要求,更不用说有效地对接它们了,都是令人望而生畏的。化学空间对接克服了这些障碍。

虽然大范围筛查更可取,但计算资源总是有限的。作者的方法通过关注最有希望的构建块进行扩张来实现平衡,这是一种所谓的贪婪优化策略。贪婪方法既需要加法得分,也需要最优部分解才能得到最优完全解。最优得分的复合姿势有望在结合部位内其所有组件的相互作用中获得有利得分。由于这里介绍的方法从第一次传递中考虑的所有构件开始,因此对于一个多组分、得分最高的分子来说,它的至少一个组成部分也将在第一次传递中成为得分最高的解决方案。此外,得分最高的组件可能会在贪婪的迭代中作为解决方案存活下来。应该注意的是,与通过当前贪婪的启发式方法引入的不太可能的遗漏相比,对通过暴力对接可以彻底搜索的候选分子的实际数量的限制可能会对寻找最佳分子构成更大的限制。

本文给出的结果表明,基于结构的方法可以扩展到广大化学空间,这在以前受限于基于化学图或简化表示的搜索。作者希望,利用蛋白质结构信息进行如此大规模的搜索将极大地提高通过虚拟筛选识别的化学先导的数量、质量和新颖性。

方法

对接规则和化学空间定义

作者的虚拟筛选工作流程的初始阶段是为虚拟筛选定义适当的停靠协议。选择2ETR结构是因为它的结合部位可以容纳来自其他PDB ROCK1条目的配体,并且在ATP结合部位具有明确的电子密度。此外,当需要典型的激酶铰链结合基序时,对接效果最好:(1)对齐和氢键供体位于Glu321主链羰基的氢键距离内,或(2)配体氢键受体在Met 323主链氮的氢键距离内。

构建块片段

使用这篇文章的基于反应的对接方法搜索的化合物集是从Enamine Real Space化合物的两组分子集构建的,包括71,894个构建块和102个反应,最多可能有858,125,390个虚拟产物分子。构建块是一种含有可参与化学反应的官能团的分子。构建块片段(或简称片段)来源于构建块,它是通过保留反应后剩余的部分构建块并引入定义与互补片段的连接性的伪连接物原子获得的。一个构建块可以包含一个以上的官能团,因此可以产生一个以上的不同片段。所有构建块片段都被对接,并选择最佳姿势进行进一步评估。然后,遵循可用的反应方案,对这组片段进行了完整的化学产物的组合扩展和对接。最后,对对接的产物进行进一步筛选,以确定最有希望的分子。

生物试验

人ROCK1蛋白购自Carna Biosciences。该序列含有蛋白质的催化域,用HTRF Kinase-STK S2 Kit测定其生化活性。为了测定IC50,化合物首先由Echo Liquid Handler(Labcell)分配到白色384孔板(PerkinElmer,Cat#6008289)中。在化合物中加入3μL的2XRECK1酶溶液,室温孵育10min,然后加入2XATP和STKS2多肽溶液,在室温下启动1h的酶反应。最终反应条件为1.5nM ROCK1,3μMATP,0.5μM STK S2多肽:50 mM HEPES pH 7.2,10 mM氯化镁,0.1%BGG,0.005%Brij-35,1 mM DTT。加入6μL链霉亲和素XL665和链霉亲和素抗体隐酸盐(Cisbio)的检测混合物,室温孵育1h后熄灭反应。在PHERAstar阅读器上读取HTRF(665 nm/620 nm)信号。

X射线结构确定

在昆虫细胞中表达人ROCK1。在4℃条件下进行纯化,首先进行Ni-NTA亲和层析,然后对His标签进行TEV切割。TeV裂解的ROCK1通过第二个Ni-NTA柱,在100 mM的氯化钠,20 mM的HEPES/NaOH,pH 7.5和2 mM的乙醇胺中分离ROCK1蛋白。收集峰分数,浓缩至22 mg/ml,在液氮中迅速冷冻,并储存在−80°C。用缓冲液将蛋白质稀释至16 mg/ml进行结晶。蛋白质在冰上以1 mM的浓度与相应的配体孵育1小时(从100 mM的DMSO原料中添加)。对于0.5微升的蛋白质/配基溶液的结晶(悬滴),将0.5微升的储存液混合并在Linbro平板(Jena Bioscience GmbH)中培养超过100微升的储存液。储集液中含有15~17%的PEG5K MME,0.1M HEPES/NaOH pH 7.5,5%(v/v)塔西姆酸盐pH 7.5。X射线衍射数据是在Swiss Light Source(Villigen,瑞士)用Eiger探测器(Dectris)在光束线PXII/X10SA上收集的,并用AutoPROC处理。用MOLREP进行分子置换,用COOT建模,用REFMAC5定义。在结晶学不对称单元中观察到四个副本的激酶结构域,D链的电子密度很低,表明存在显著的无序,但有足够的信号表明它的存在。因此,作者在这项工作中将该分子排除在分析考虑之外,而是专注于链A,其中蛋白质和配体都相对定义良好。虽然值得注意的是,实际空间RSRZ符合标准,链D中有较高的B因子,以及全局R因子的一些升高,但A、B和C链为分析提供了更稳健的底物。Ramachandran图谱显示, ROCK1-化合物1复合体结构有0.07%的异常值和98.06%的偏好性几何构型;对于ROCK1-化合物22复合体结构,0.22%的异常值和95.05%的偏好性几何构型。

参考资料

Beroza, P., Crawford, J.J., Ganichkin, O. et al. Chemical space docking enables large-scale structure-based virtual screening to discover ROCK1 kinase inhibitors. Nat Commun 13, 6447 (2022).

https://doi.org/10.1038/s41467-022-33981-8

nat

0 人点赞