Drug Discov Today | 利用系统的蛋白质-配体相互作用指纹图谱进行药物发现

2022-11-16 16:31:00 浏览数 (1)

2022年7月16日,来自弗吉尼亚大学数据科学学院和生物医学工程系的Philip E.Bourne和Zheng Zhao等人在Drug Discovery Today上发表文章,作者回顾了系统的蛋白质-配体相互作用指纹(IFP)方法在药物开发方面的最新进展和成功应用。

具体来说,回顾了这种IFP方法在揭示整个激酶组的多重药理学、预测设计变构抑制剂和共价激酶抑制剂的有效靶点、揭示部分药物的结合机制、展示特定药物的耐药机制等方面的作用。证明了IFP策略对于以蛋白激酶为靶点的药物设计研究是有效和实用的,并且可以扩展到其他蛋白质家族。

计算机辅助药物筛选可大致分为三类:基于受体的方法、基于配体的方法和基于蛋白质-配体相互作用的方法。随着结构生物医学数据科学的出现,大量的蛋白质结构和生物活性分子被编译,为开发基于蛋白质-配体相互作用的方法提供了坚实的基础,如基于药效团和基于IFP的方法。

基于蛋白质-配体IFP的方法是使用一组预定义的相互作用类型(如范德华力等)和相关标准,将蛋白质-配体相互作用的细节编码为二进制串,使用编码的二进制串,可以详细捕获并轻松操作任何配体结合复合物的结合特征。Deng等人2004年首次提出结构IFP(S-IFP)方法,蛋白质-配体IFP策略得到改进,并很快应用于虚拟筛选、对接方式的后处理和评分功能等方面。但是S-IFP这些应用仅限于用于相同的受体或一簇高度同源的蛋白质结构。

为了探索用于个性化药物发现的蛋白质组规模的多重药理学,作者提出了Fs-IFP方案,结合了结构系统药理学和S-IFP策略。首先,使用Fs-IFP确定整个蛋白质组的受体结合口袋;其次,使用IFP策略将每个结合口袋的每个已知复合物编码为二进制串;最后,通过提取对齐的“口袋”和相应的指纹串来获得可比较的IFP。利用这种Fs-IFP方案,作者将S-IFP策略扩展到多个蛋白质家族,无论它们是高度同源或彼此相距甚远,从而揭示了结合的特征和意义。

1.IFP方法综述

指纹的每个位置都代表描述给定蛋白质-配体相互作用的配对元素类型。基于蛋白质环境,可以进一步描述原子类型。SYBYL方案根据原子的化学性质将原子分为不同的子类型。

Deng等人2004年提出了一种结构IFP方案,称为S-IFP,用于对蛋白质-配体相互作用进行结构表征,原子种类通过SMARTs定义。S-IFP方法用一维二进制字符串编码蛋白质-配体相互作用(图1a)。具体来说,每个残基(包含结合口袋)通过预定义几何标准被编码为一个7位数的二进制子字符串。7位二进制子串描述了每个氨基酸对蛋白质-配体相互作用的贡献,并代表了7种相互作用(无论是否存在),包括:(I)与配体的接触;(II)涉及主链原子;(III)涉及侧链原子;(IV)极性相互作用;(V)非极性相互作用;(vi)氢键相互作用(氨基酸作为受体);和(VIII)氢键相互作用(氨基酸作为供体)。基于S-IFP,有研究者添加了两个额外的相互作用(芳香族和带电),创建了描述每个残基和配体之间相互作用的9位二进制子串。

后有研究者将蛋白质-配体相互作用编码为具有11 位子串阵列的一维二进制IFP字符串(图1b),其描述了每个氨基酸如何与配体相互作用。结合口袋中的每个氨基酸被编码成一个11位子串,对应于11种类型的相互作用:(I)疏水相互作用;(II)芳香相互作用(面对面);(III)芳香相互作用(边-面);(IV)氢相互作用(蛋白质原子作为受体);(V)氢相互作用(蛋白质原子作为供体);(vi)离子相互作用(带正电荷的蛋白质原子);(VII)离子相互作用(带负电荷蛋白质原子);(VIII)弱氢相互作用(蛋白质原子作为受体);(IX)弱氢相互作用(蛋白质原子作为供体);(X)π-阳离子相互作用;和(Xi)与配体的金属离子相互作用。

图1:(a) 使用结构相互作用指纹图谱(S-IFP)方法为每个结合口袋残基编码的七种类型的相互作用。(b) Rognan小组在IFP方法中编码的11种类型的相互作用。“1”表示存在相互作用,“0”表示与残基没有相互作用。

另一类高级IFP是扩展连通性指纹(ECFPs),其编码配体和结合位点内的紧密蛋白质原子之间的所有局部相互作用。与早期的S-IFP方法相比,基于ECFP的IFP是基于蛋白质片段的,并且通过迭代将相互作用的原子对散列成整数,然后折叠虚拟字符串,而基于S-IFP的IFP是基于残差的并且需要使用预定义的几何规则来编码。Fs-IFP方法适用于蛋白质组药物发现,对于揭示主要靶点的多重药理学是必要的,对于非靶点的揭示也仍然必要。

Fs-IFP方法有四个步骤(图1c)。第1步:构建结构数据集,包括所有配体结合的蛋白质复合物,所有这些都可以从蛋白质数据库(PDB)或PDB结合数据库下载。第2步:使用序列顺序无关的结合位点比对方法(例如SMAP)来对齐所有结合位点,该方法提供序列顺序无关的二级结构比对并输出相应的匹配残基矩阵。第3步:使用离线工具(如iChem)将每个复合物中的所有蛋白质-配体相互作用类型编码到位串的一维阵列中。具体来说,每个复合物的结合位点中的每个残基都被编码成一个7位子串。第4步:使用每个结合位点的相应7位IFP替换残基矩阵中的每个氨基酸。

图1c S-IFP方法的流程图

2.Fs-IFP方法在药物发现中的应用

1)揭示跨蛋白质组的配体结合模式

Fs-IFP方法提供了一种在蛋白质组中探索多重药理学的实用方法。在一项研究中,作者首先从208个激酶中收集了2383个复合物结构,用作激酶数据集。然后,按照Fs-IFP协议,从所有激酶-配体复合物中获得一组可比较的FS-IPP编码的IFP。随后,在整个人类基因组中对ATP结合口袋和/或其附近的不同抑制剂的结合特征进行了分类。激酶结合模式分为五类,具有相应的结合特征和位置(图2a)。

图2a:以伊马替尼为例,五类结合簇

Fs-IFP方法的另一个应用涉及抗病毒药物发现,揭示了47种RNA病毒的结合模式,特别是冠状病毒(COVID-19)。

2)揭示用于设计精确抑制剂的特定相互作用特征

作者利用Fs-IFP方法确定哪些半胱氨酸可用于人类基因组,以促进共价激酶抑制剂的发现,已知共价激酶抑制剂显著提高了整个基因组的结合亲和力和选择性。作者验证了前五个最容易获得的区域的位置(图3c)。这些对半胱氨酸相关共价反应性的深入了解有助于设计和发现新的共价激酶抑制剂。

图3c:前五名最容易获得的半胱氨酸的位置

3)开发跨蛋白质组的新型抑制剂

作者使用Fs-IFP方法发现了变构激酶抑制剂。目前,已经报道了不同类型的激酶抑制剂,它们占据结合口袋的不同区域。

I型激酶抑制剂,也称为ATP竞争性激酶抑制剂,占据位于激酶结合位点的前裂缝中的ATP结合区域,特别是铰链区、疏水袋、P环和DFG肽之间的空间(图4a)。II型激酶抑制剂占据ATP结合的前裂缝,但也延伸到附近的变构区域(图4b)。变构区域不像ATP结合口袋那样保守,因此,开发激酶变构区域是一种很有前途的策略,可以在整个激酶组中实现所需的选择性。靶向MEK的变构激酶抑制剂(图4c),P38α、BRAF和EGFR都已有报道主要集中在丝裂原活化蛋白激酶(MEK)。目前,所有已批准的变构药物都是MEK靶向的。作者试图探索MEK-变构抑制剂的结合特征,以设计针对MEK以外的激酶的变构激酶抑制剂。

基于结合特征,作者预测了哪些激酶靶点有望用于变构抑制剂的设计(图4d)。根据这些预测,在前15个激酶靶点中,包括MEK在内的10个属于STE组,3 个(MAST 1–3)来自AGC组,1个(JAK3)来自TK组,1个(NRBP1)来自另一组,这表明在寻找III型变构激酶抑制剂中有希望的靶点。

图4:(a)I型激酶抑制剂的结合模式。(b)II型激酶抑制剂的结合模式。(c)靶向MEK的变构抑制剂的结合模式。(d)使用软件设计变构抑制剂的前15个预测激酶靶点。

4)证明耐药机制

Fs-IFP结合表面自由能的研究确定药物的作用机制可促进下一代抗癌药物的开发。

克唑替尼是被用来治疗NSCLC的第一代ALK 药物,但ALK的守门人(gatekeeper)突变(L1196)影响NSCLC的临床治疗。络合结构的排列表明,克唑替尼是一种I型ALK抑制剂,并且在L1196M突变前后的结合模式相似(图5a)。克唑替尼的耐药性与P环片段内残基相互作用的变化有关。后用相同的Fs-IFP方法,探索了赛瑞替尼(克服L1196M突变的第二代药物)的结合机制,发现赛瑞替尼是通过增强与P环残基的相应相互作用来克服L1196M 突变(图5b)。鉴于这个例子,Fs-IFP方法结合伞形采样和自由能计算的系统应用是揭示耐药机制的有希望的方法。

图5:(a)克唑替尼在L1196M突变前后间变性淋巴瘤激酶(ALK)结合位点中的相似结合特征。(b)与塞瑞替尼结合的ALK复合物。

3.结束语和讨论

Fs-IFP方法在药物设计和发现中显示出良好的前景。该方法将任何给定的蛋白质-配体复合物的相互作用特征编码到位串中,便于大规模数据分析。此外,结合位点比对是基于一种不依赖于序列顺序的结构比较方法,这使作者能够在蛋白质组中探索具有不同序列的相似靶点。同时基于结合位点内匹配残基,可比较的二元IFP提供了一种方便的方法来分析结合模式和训练机器/深度学习模型。

耐药性是一个主要的限制因素。在赋予耐药性前后使用通过结合Fs-IFP方法和其他方法(如表面自由能计算)是开发下一代抗耐药性药物的有效方法。

S-IFP相关方法,包括Fs-IFP,依赖于预先存在的蛋白质-配体复合物资源。S-IFP方法的局限性在于如何准确检测和编码蛋白质-配体相互作用。目前,检测蛋白质-配体相互作用模式是否存在基于预先定义的几何规则,其限制意味着一些相互作用类型不被计算在内,如金属相互作用。因此,需要更多相互作用模式的预定义。

最近,扩展连接性指纹(ECFP)被应用于编码基于配体和蛋白质亚结构之间每对原子间相互作用的所有原子/键相互作用类型。

S-IFP相关方法的另一个几何限制是需要预先定义氢键相互作用、静电相互作用等的几何规则。简单但严格的截止规则可能会忽略一些边际相互作用。通过进行分子动力学(MD)模拟以提供灵活的配体结合特征会一定程度缓解这种问题。收集每个构象的所有IFP以及MD轨迹,IFP有效性会更高。

参考资料

Zhao Z, Bourne PE. Harnessing systematic protein-ligand interaction fingerprints for drug discovery. Drug Discov Today. 2022 Jul 16:S1359-6446(22)00289-6. doi: 10.1016/j.drudis.2022.07.004.

--------- End ---------

0 人点赞