DRUGAI
今天为大家介绍的是来自Paraskevi Gkeka以及M. Bonomi团队的一篇论文。用小分子进行RNA的靶向受限于我们对RNA结构和动态特性的理解仍然有限。大多数用于结合位点识别的计算工具依赖于静态结构,因此无法应对RNA分子动态特性带来的挑战。在此,作者介绍了一种名为SHAMAN的计算技术,用于识别RNA结构集中的潜在小分子结合位点。SHAMAN通过原子分子动力学模拟探索RNA的构象,同时借助探针和增强采样技术高效地识别RNA口袋。在包括大型、结构化核开关以及小型、灵活病毒RNA的基准测试中,SHAMAN成功识别了所有实验解析的结合位点。总体而言,SHAMAN为未来以小分子为目标的RNA药物设计工作奠定了坚实的基础,有效解决了该领域长期存在的挑战。
RNA分子最初被认为仅仅是将遗传信息从基因传递到蛋白质的载体,而现在已知它们执行多种生物功能,例如调节蛋白质合成过程和抵御外来核酸进入细胞。随着这些发现,调节RNA功能正成为治疗癌症、病毒感染、心血管和肌肉疾病以及神经退行性疾病等的有前景的治疗方法。除了传统的方法,如设计干扰mRNA的反义少核苷酸或直接用CRISPR-Cas9编辑RNA外,用小分子靶向RNA也正成为一种有前途的策略,其具有潜在靶标数量多、生物利用度和递送优势。尽管近年来这一领域的研究激增,但FDA批准的药物数量仍然有限,目前市场上的化合物完全通过昂贵且耗时的实验筛选找到。
计算机辅助药物设计(CADD)提供了若干基本工具,以协助药物发现的各个阶段,从药物成药性评估到虚拟筛选以识别初步药物、结合亲和力计算及先导优化的生成方法。这些工具在蛋白质领域已得到充分建立,但其在RNA分子中的应用仍处于起步阶段。现有的生化和结构数据逐渐阐明了RNA结合物的化学性质以及RNA结合位点的结构特性。这些知识促进了基于配体和二维结构的虚拟筛选方法、三维结合位点检测工具、对接软件及特定于RNA分子的评分函数的发展。然而,我们对RNA分子的结构和动态特性及其与小分子相互作用的理解仍然有限,从而最终阻碍了新型高效化合物的理性设计。
在细胞环境中,功能特异的生物信号触发复杂的多步骤RNA构象变化,从而引导各种RNA功能,如配体感应和信号传导、催化或共转录折叠。这些构象变化和潜在的动态性受到RNA分子固有的灵活性(即许多大规模运动模式跨越各种时间尺度)以及其他细胞共因子的影响。唯一的例外是SILCS-RNA,它通过类似于已经广泛用于蛋白质的小溶剂探针方法,探索目标RNA的构象以识别潜在结合位点。尽管SILCS-RNA可以描述由探针引起的小结构重排,但它并非设计用于捕捉大的RNA构象变化,因此它无法检测到在亚稳态中存在的结合位点,这些结合位点虽然少量存在但对于治疗应用至关重要。
SHAMAN方法概述
图1:SHAMAN方法的概述
SHAMAN是一种计算技术,使用小片段或探针以及原子级显性溶剂分子动力学(MD)模拟,来识别RNA结构集合中的潜在小分子结合位点(图1A)。SHAMAN基于一种独特的架构,其中系统的多个副本同时进行模拟(图1B)。母模拟只包含RNA和可能的结构离子,探索目标的构象景观,并将RNA原子的位置信息传递给副本。每个副本包含一个不同的探针,使用元动力学增强采样方法探索母模拟提供的RNA构象。对副本的RNA主链原子施加软位置限制,允许探针引起的局部诱导适应效应,同时跟随或“影随”母RNA模拟的构象变化。这种并行架构使不同探针能够高效探索相同的RNA构象,并为每个代表性RNA构象簇识别出一组潜在的小分子结合位点或SHA-MAPs(图1C)。每个SHAMAP对应一个被至少一个探针高概率占据的空间区域,并根据探针与特定RNA构象的结合自由能ΔG进行排名(图1D)。
SHAMAN准确性的基准测试
图2:评估SHAMAN的准确性
SHAMAN在识别实验解析的结合位点方面的准确性在7个生物相关系统上进行了评估,包括核开关(图2A)和病毒RNA(图2B)。对于每个系统,SHAMAN模拟从去除配体后的全构象(holo-like)和可用时的apo构象开始初始化,总共进行了12次运行。对于每次模拟,准确性通过SHA-MAPs与参考实验结构中配体位置之间的距离来定义(图2C)。
为了量化排名,作者定义了每个SHA-MAP与最低自由能的SHA-MAP之间的结合自由能差ΔΔG。当从目标RNA的apo构象开始时,与配体重叠的SHA-MAPs的ΔΔG在80%的情况下低于kBT,在100%的情况下低于2kBT(图2D)。当从全构象开始时,这些百分比分别降至64%和84%。
作者的SHA-MAPs与基准测试集中实验结合位点的几何接近性值得注意。在与配体重叠的交互位点中心与实验结构中配体位置之间的平均距离在全构象(图2E上)和apo(图2E下)情况下分别为3.8 Å和4.4 Å。在全构象中初始化的模拟中,这种与实验结合位点的接近性显著更大,因为这些模拟中结合位点已经存在。事实上,全构象模拟中识别的成功交互位点中有22%在作者距离阈值的一半范围内接近实验口袋,而apo模拟中这一比例仅为1%。
探针分析
在之前章节描述的SHAMAN基准测试中使用了两组探针。第一组由8种探针组成,这些探针之前在SILCS-RNA的开发中使用,主要由选择来代表与RNA目标的特定相互作用类型的化合物构成。该组包括:乙酸盐(ACEY)、苯(BENX)、二甲醚(DMEE)、甲酰胺(FORM)、咪唑(IMIA)、甲基铵(MAMY)、甲醇(MEOH)和丙烷(PRPX)。第二组由5种探针组成,这些探针是在本研究中使用片段化协议生成的,这些协议应用于(i) HARIBOSS数据库中的RNA-配体解析结构(https://hariboss.pasteur.cloud)以及(ii) R-BIND数据库中的针对RNA的生物活性小分子(https://rbind.chem.duke.edu)。第二组主要包括芳香化合物:苯(BENX)、二氢-吡啶-嘧啶酮-咪唑-吡啶(BENF)、苯并噻吩(BETH)、甲基嘧啶(MEPY)和环状非芳香性哌嗪(PIRZ)。
图3:SHAMAN探针分析
作者首先探索了成功识别实验结合位点的探针与RNA口袋的一些结构特征之间的关系。芳香探针显示出探索RNA结构内部深处的空腔倾向(图3A,深绿色条),其估计的平均埋藏度为0.75 ± 0.06,相较于已知的RNA-小分子结合口袋较高(图3B)。另一方面,非芳香探针显示出两种不同的模式。FORM、MEOH和MAMY选择性地探索浅口袋,其平均埋藏度为0.59 ± 0.04(图3A,橄榄绿色条),而DMEE、PRPX和ACEY则广泛探索不同溶剂暴露的口袋,平均埋藏度为0.70 ± 0.08。PIRZ表现出中等行为,其平均埋藏度为0.65 ± 0.06(图3A,棕色条)。芳香探针在识别核开关结合位点方面特别成功,这些结合位点通常位于埋藏的空腔中(图3C)。例如,代表性核开关结合物GNG(PDB 3ski)的定位仅由芳香探针识别(图3D)。另一方面,脂肪族探针在病毒RNA中识别高概率(70%)的口袋(图3E),由于其固有的灵活性导致了暴露于溶剂中的浅空腔。例如SS0,这种典型的病毒RNA结合物(PDB 3tzr)的结合位点主要由非芳香探针识别(图3F)。
与其他工具的比较
作者将SHAMAN与三种最先进的RNA小分子结合位点预测计算工具进行了比较:SiteMap、BiteNet和RBinds。针对基准测试集中的所有系统,作者测试了这些工具正确预测与实验确定结构中小分子相互作用的RNA核苷酸的能力。首先,作者仅使用相应的实验holo结构作为基准确定从holo-like构象获得的预测质量。
图4:与其他工具的比较
在Matthews相关系数方面,SHAMAN和BiteNet的表现优于SiteMap和RBinds(图4A)。SiteMap和RBinds的低MCC分数主要是由于其低准确性和精确度。虽然SHAMAN和BiteNet的预测质量相当,但作者的方法在基准测试集中精确度较为波动,倾向于高估相互作用核苷酸的数量。鉴于SHAMAN考虑了RNA目标的灵活性,作者假设这是由于预测了单个holo结构中未出现的替代结合口袋。采用这种定义后,SHAMAN的精确度和整体MCC分数有所提高(图4B),支持了作者的假设。最后,为了模拟仅有apo状态结构可用的常见药物发现情景,作者测试了从apo构象获得的预测质量。在这种情况下,SHAMAN预测的质量优于BiteNet(图4C),因为作者的方法能够高准确度和精确度地识别所有参考实验结构中正确的相互作用核苷酸集。这些结果清楚地表明,不考虑RNA目标灵活性的预测工具无法预测局部或全局结构重排后形成的结合位点。
FMN核开关的案例分析
图5:FMN核开关的案例
FMN核开关是一种存在于细菌中的RNA分子,通过与FMN代谢物结合来调节FMN基因的表达。截至目前,PDB数据库中共存有19个FMN核开关的X射线结构,其中3个为apo构象,16个为holo构象。在这些holo结构中解析出的9个独特的小分子可以分为三大类:天然FMN家族、合成的ribocil家族和四环DKM结合物。属于FMN和ribocil家族的配体呈现出U形构象,并占据相同的结合位点,这个位点埋藏在 RNA 结构内,位于六个交界区域之间的A-48和A-85碱基之间(图5A)。DKM四环配体则表现出不同的结合模式,它类似于apo形式诱导A-48翻转并在A-48和G-62之间面对面堆叠(图5B)。
因此,作者尝试通过SHAMAN以捕捉FMN核开关的局部重排并识别从单一静态结构开始的两种结合构象。作者分别从holo-like(PDB 6dn3)和apo(PDB 6wjr)结构开始测试 SHAMAN。成功识别此埋藏口袋的大多数探针都是芳香探针,分别在holo-like和apo情况下占83%和75%(图5E)。
值得注意的是,FMN和DKM配体的两种不同结合模式在从holo-like和apo构象开始的两次运行中都以相似的准确度被识别出来。SHAMAN 能够识别两种结合模式,这是基于静态结构的算法无法做到的。如图5C、D所示,通过将holo-like和apo模拟中发现的SHAMAPs叠加到相应的起始结构上,上述论点得到证明。在holo-like情况下,BENX和IMIA探针捕捉到FMN结合物的尾部(左侧图5F,分别为黑色和绿色表面),而BENF和MEPY则与DKM的四环部分重叠(右侧图5F,分别为橙色和天蓝色表面)。在apo情况下,MEPY相互作用位点与两种配体都重叠,但DKM的四环部分仅由IMIA捕获(图5G)。
HIV-1 TAR的案例分析
图6:HIV-1 TAR的案例
HIV-1转录激活反应元件(HIV-1 TAR)是一种高度灵活的非编码RNA分子,通过与Tat蛋白结合来调节HIV-1基因的表达。由于与不同的配体结合时会发生重大结构变化,理解其构象动态对于药物开发至关重要,但仍然充满挑战。HIV-1 TAR的这种构象可塑性体现在超过20种已解析的结构中,这些结构主要通过NMR技术解析,单独存在或与不同的配体结合在暴露于水的空腔中。作者的验证集中包括5个与不同小分子以不同结合模式结合的holo结构,这些小分子结合在隆起的UCU和顶端环CUGGGA之间的槽中(图6A)。这是一个关键区域,也编码Tat蛋白的结合位点。其中一个结构(PDB 2l8h)表明在与小分子MV2003结合后形成了一个瞬时且功能相关的口袋。鉴于其复杂的动态性,HIV-1 TAR构成了检测靶分子整体构象变化后出现的结合位点能力的重要基准。
作者分别从HIV-1 TAR的两个结构开始测试 SHAMAN,一个为holo-like构象(PDB 1uts),另一个为apo构象(PDB 1anr)。在这些SHAMAPs中,SHAMAN识别了所有5个实验结合位点,尽管RNA与已存储结构的整体相似性从未低于~3 Å骨架 RMSD。与实验配体的最准确重叠出现在holo构象中的b和e构象(图6D)以及apo构象中的a、c和d构象(图6E),其主要由脂肪族探针检测到(图6F)。
值得注意的是,SHAMAN 能够识别 Davidson等人提出的隐蔽结合口袋。在作者的模拟中,这个位点由ACEY和MAMY探针在e构象中检测到(分别为红色和粉红色密度,见图6C中的橙色残基)。
讨论
本文介绍了SHAMAN,一种基于全原子分子动力学模拟的小分子结合位点识别技术。通过对已知RNA-小分子结构的基准测试,验证了其在识别结合位点方面的高准确性。SHAMAN 能够从holo-like和apo构象中准确定位结合位点,并在刚性核开关与高柔性病毒RNA分子中均表现出优异的预测能力。与现有方法不同,SHAMAN 允许 RNA 分子进行局部和全局构象变化,从而识别动态RNA构象中的结合位点。这一方法在检测难以发现的结合位点方面表现出显著优势,为未来RNA靶向药物设计提供了重要工具。
编译 | 于洲
审稿 | 曾全晨
参考资料
Panei F P, Gkeka P, Bonomi M. Identifying small-molecules binding sites in RNA conformational ensembles with SHAMAN[J]. Nature Communications, 2024, 15(1): 5725.