作者 | 陈梓豪 审稿 | 余梁
今天给大家介绍是Nature Structural & Molecular Biology上的一篇文章correspondence“Can AlphaFold2 predict the impact of missense mutations on structure?”。
AlphaFold2实现了从氨基酸序列预测蛋白质结构的目标,这是一个里程碑式的成就。虽然AF2的结构预测算法能够准确预测野生型(wild-type,WT)结构,但在预测错义突变对蛋白质三维结构的影响上似乎存在不足。这是因为没有错义突变的数据库,因此AlphaFold2主要基于WT或同源序列进行预测。在本文中,作者使用了三个例子来说明AF2的局限性,这三个例子都是针对WT和错义突变的实验数据。
错义突变经常与人类疾病相关,而单个氨基酸突变可导致蛋白质聚集、错误折叠和功能障碍。能够预测感兴趣的突变对蛋白质三维结构的影响,将有助于结构生物学家和非结构生物学家对其致病性机制做出合理的假设。
图1
图1a展示了hHR23a蛋白质上的泛素相关结构域(ubiquitin-associated domains,UBAs)。蛋白酶体穿梭因子和hHR23a的两个uba含有一个中央亮氨酸(UBA1中L198, UBA2中L355),该亮氨酸埋藏在核心中,是结构完整性所必需的。按照常理来说,丙氨酸取代使uba本质上紊乱。然而,AlphaFold2预测丙氨酸取代的UBA1(图1a)或UBA2(未显示)在结构上与WT UBA相同,只有微小的折叠差异。作者使用均方根偏差(r.m.s.d.),对主链α-碳(Cα)原子的重叠结构原子之间的距离的测量,以量化预测WT和突变体结构的相似性。结果表明,丙氨酸取代结构和WT UBA结构域的平均Cα r.m.s.d.为0.1 Å,UBA1为0.3 Å;相比之下,这些差异小于两个WT 的hHR23a UBA结构域的0.7 Å Cα r.m.s.d.(未显示)。同时,在图1b中,替换丙氨酸产生的疏水核在AlphaFold2局部距离差异测试(pLDDT,一项旨在表明预测结构的置信度的统计测试的分数)的平均分数是相等的,表明对丙氨酸取代较长的亮氨酸侧链所造成的影响不敏感。
此外,作者还在乳癌基因(图1c)和肌动蛋白运动蛋白肌球蛋白VI MyUb结构域(图1d)中进行了相似的实验,AF2对错义突变的蛋白质结构预测的pLDDT分数几乎相等。
综上所述,尽管AF2标志着蛋白质结构预测的关键进步,但作者发现它在很大程度上无法预测点突变何时会导致蛋白质折叠缺陷。事实上,最近的一项调查发现,pLDDT得分与绿色荧光蛋白中氨基酸替换引起的蛋白质错误折叠没有相关性。这种相关性的缺乏与本文的案例研究一致,说明了AlphaFold2无法预测点突变对蛋白质结构的影响。这种局限性可能是因为它预测的结构是基于PDB中可用的结构,而不是基于蛋白质折叠的基本驱动力。AlphaFold2与蛋白质结构分子动力学模拟的现代和预期的进展相结合,可能会克服这一限制。或者,建立一个数据库来存储破错义突变的结构,可能允许AlphaFold2或其他人工智能程序的未来再现,将这些信息包括在他们的蛋白质折叠预测中。
参考资料
Buel, G. R., & Walters, K. J. (2022). Can AlphaFold2 predict the impact of missense mutations on structure?. Nature Structural & Molecular Biology, 29(1), 1-2.
https://www.nature.com/articles/s41594-021-00714-2