Nature 2024年值得关注的七项技术

2024-01-29 09:59:41 浏览数 (2)

今天为大家介绍的是来自Michael Eisenstein的一篇论文。今年许多最令人兴奋的技术创新领域,都离不开人工智能的进步。

深度学习在蛋白质设计中的应用

二十年前,华盛顿大学西雅图分校的David Baker和他的同事们实现了一个里程碑式的成就:他们使用计算工具从头开始设计了一种全新的蛋白质。这种被命名为“Top7”的蛋白质按预期折叠,但它是惰性的,没有执行任何有意义的生物功能。如今,从无到有的蛋白质设计已经成熟到可以用来制造按需订制的酶和其他蛋白质。“这非常牛,” 华盛顿大学的生化学家Neil King说,他与Baker的团队合作,设计基于蛋白质的疫苗和药物传输工具。“一年半前不可能的事情,现在就能做到了。”这些进展很大程度上归功于日益庞大的数据集,这些数据集将蛋白质序列与结构联系起来。但深度学习这种人工智能(AI)的高级方法也是至关重要的。

大型语言模型(LLMs)使用基于“序列”的策略,比如ChatGPT这样的聊天机器人工具。通过将蛋白质序列视为由多肽“词汇”组成的文档,这些算法可以识别出现实世界蛋白质建筑手册中的模式。“它们真的学会了隐藏的语法,”西班牙巴塞罗那分子生物学研究所的蛋白质生物化学家Noelia Ferruz说。2022年,她的团队开发了一种名为ProtGPT2的算法,通过该算法在实验室中生产的蛋白质能够稳定折叠。Ferruz还与人共同开发了一种名为ZymCTRL的工具,该工具利用序列和功能数据来设计自然存在的酶家族的成员。

基于序列的方法可以在现有蛋白质特征的基础上建立和调整新框架,但对于定制结构元素或特征(例如能够以可预测方式结合特定靶点的能力)就效果不佳。基于“结构”的方法在这方面表现更好,2023年在这种蛋白质设计算法中也取得了显著进展。其中最复杂的一些使用了“扩散”模型,这些模型也是像DALL-E这样的图像生成工具的基础。这些算法最初被训练用来从大量真实结构中去除计算机生成的噪声;通过学会从噪声中辨别出真实的结构元素,它们获得了形成生物学上可信的、用户定义的结构的能力。Baker实验室开发的RFdiffusion软件和马萨诸塞州索默维尔的Generate Biomedicines开发的Chroma工具,利用这种策略取得了显著效果。例如,Baker的团队正在使用RFdiffusion来设计能够与感兴趣的目标紧密结合的新型蛋白质,产生的设计“完美地适应表面,”Baker说。RFdiffusion的一种更新的“全原子”版本允许设计师在计算上围绕非蛋白质目标(如DNA、小分子甚至金属离子)形成蛋白质。所带来的多功能性为工程化酶、转录调节剂、功能性生物材料等开辟了新的视野。

深度伪造检测

随着公开可用的生成型人工智能算法的爆炸性增长,合成逼真但完全人工的图像、音频和视频变得简单。这些成果可以提供有趣的消遣,但在多个持续的地缘政治冲突和即将到来的美国总统选举的背景下,武器化媒体操纵的机会日益增多。纽约布法罗大学的计算机科学家Siwei Lyu表示,他看到了许多与以色列-哈马斯冲突有关的人工智能生成的“深度伪造”图像和音频。这只是AI用户制作欺骗性内容和liu以及其他媒体取证专家努力检测和拦截这些内容的最新一轮博弈。

一种解决方案是生成型AI开发者在模型输出中嵌入隐藏信号,以生成AI生成内容的水印。其他策略专注于内容本身。例如,有些被操纵的视频将一位公众人物的面部特征替换成另一位的,而新算法可以识别被替换特征边界处的痕迹。一个人的外耳独特褶皱也可以揭示面部和头部之间的不匹配,而牙齿中的不规则性可以揭示编辑过的唇形同步视频。AI生成的照片也带来了棘手的挑战——并且是一个不断变化的目标。2019年,意大利的媒体取证专家Luisa Verdoliva帮助开发了FaceForensics ,这是一个用于识别由几种广泛使用的软件包操纵的面部的工具。但图像取证方法是特定于主题和软件的,而泛化是一个挑战。“你不能只有一个单一的通用检测器——这非常困难,”她说。

然后还有实施的挑战。美国国防高级研究计划局的语义取证(SemaFor)计划已经开发了一个对深度伪造进行分析的有用工具箱,但正如《自然》杂志所报道的,主要的社交媒体网站并没有常规使用它。扩大对这类工具的访问可以帮助促进使用,为此,liu的团队开发了DeepFake-O-Meter,这是一个集中公开的算法库,可以从不同角度分析视频内容,以便识别深度伪造内容。这些资源将是有用的,但抗击AI生成的虚假信息的战斗可能还会持续多年。

大片段DNA插入

2023年末,美国和英国的监管机构首次批准了基于CRISPR的基因编辑疗法,用于治疗镰状细胞病和输血依赖性β-地中海贫血——这是基因编辑作为临床工具的一大胜利。CRISPR及其衍生物使用一段可编程的RNA来指导DNA切割酶(如Cas9)到特定的基因组位置。它们在实验室中常用于禁用有缺陷的基因和引入小的序列变化。准确且可编程地插入跨越数千核苷酸的更大DNA序列是困难的,但新出现的解决方案可能允许科学家替换有缺陷基因的关键片段或插入完全功能的基因序列。加州斯坦福大学的分子遗传学家Le Cong及其同事正在研究单链退火蛋白(SSAPs)——这些从病毒衍生的分子可以介导DNA重组。当它们与CRISPR-Cas系统结合使用时,Cas9的DNA切割功能被禁用,这些SSAPs允许精确定位地将多达2千碱基的DNA插入人类基因组。此外,还有方法利用一种称为主编辑的基于CRISPR的方法,来引入短的“着陆垫”序列,这些序列选择性地招募酶,进而可以精确地将大的DNA片段拼接到基因组中。例如,2022年,麻省理工学院剑桥分校的基因组工程师Omar Abudayyeh及其同事首次描述了通过特定靶点元素的可编程添加(PASTE)方法,该方法可以精确地插入多达36千碱基的DNA。PASTE对于外体修改培养的、源自患者的细胞特别有前途,而底层的主编辑技术已经在进行临床研究。但对于活体内修改人类细胞,SSAP可能提供一个更高效的解决方案:较为庞大的PASTE设备需要三个独立的病毒载体进行传递,这可能相对于两组分的SSAP系统编辑效率更低。即便如此,即使是相对低效的基因替换策略也可能足以减轻许多遗传病的影响。

这些方法不仅与人类健康相关。由中国科学院北京分院的Caixia Gao领导的研究人员开发了PrimeRoot,这是一种使用主编辑技术来引入特定靶点的方法,酶可以利用这些靶点在水稻和玉米中插入多达20千碱基的DNA。高认为这项技术可以广泛用于赋予作物疾病和病原体抵抗力,继续在基于CRISPR的植物基因组工程领域的创新浪潮。“我相信这项技术可以应用于任何植物物种,”她说。

脑-电脑接口

患有运动神经元疾病(又称为肌萎缩侧索硬化症)的Pat Bennett的说话速度比平均人类水平慢,且有时会用错词。但考虑到她此前因病无法口头表达,这已是一个了不起的成就。Bennett的恢复归功于一种由斯坦福大学神经科学家Francis Willett和美国BrainGate联盟的同事们开发的复杂脑-电脑接口(BCI)设备。他们在Bennett的大脑中植入了电极,以追踪神经元活动,然后训练深度学习算法将这些信号转换成语言。经过几周的训练,Bennett能够以每分钟最多62个单词的速度说话,词汇量达到125,000个单词——是普通英语使用者词汇量的两倍多。“他们交流的速度真的很令人印象深刻,”在宾夕法尼亚大学匹兹堡分校开发BCI技术的生物工程师Jennifer Collinger说。BrainGate的试验只是过去几年几项研究中的一项,这些研究展示了BCI技术如何帮助患有严重神经损伤的人恢复失去的技能,获得更大的独立性。布朗大学的神经学家、BrainGate联盟主任Leigh Hochberg说,其中一部分进展源于对各种神经疾病患者大脑功能神经解剖知识的稳步积累。这些知识已被机器学习驱动的分析方法放大,这些方法揭示了如何更好地放置电极和解密它们捕获的信号。

研究人员还在应用基于AI的语言模型来加速解释患者试图传达的内容——本质上是大脑的“自动完成”。这是Willett研究的核心组成部分,也是加州大学旧金山分校的神经外科医生Edward Chang领导的团队另一项研究的核心组成部分。在那项研究中,一个因中风而失去语言能力的女性通过BCI神经假肢以每分钟大约78个单词的速度交流——大约是英语平均速度的一半,但比该女性之前使用的语音辅助设备快五倍多。该方向在其他领域也取得了进展。2021年,科林格和匹兹堡大学的生物医学工程师Robert Gaunt将电极植入一位四肢瘫痪者的运动和感觉皮层,提供了对机器臂的快速精确控制以及触觉感知反馈。BrainGate和荷兰UMC乌特勒支的研究人员,以及纽约布鲁克林的BCI公司Synchron正在进行独立的临床研究,以及测试一种允许瘫痪人士控制计算机的系统——这是BCI设备首个由行业赞助的试验。

超高清晰度成像

Stefan Hell、Eric Betzig和William Moerner因打破限制光学显微镜空间分辨率的“衍射极限”而获得2014年诺贝尔化学奖。这一突破带来的细节级别——在数十纳米的量级——为一系列分子尺度的成像实验打开了大门。然而,一些研究人员对更好的成像仍有渴望,并且他们正在迅速取得进展。“我们真的在努力缩小超分辨率显微镜技术与结构生物学技术(如冷冻电子显微镜)之间的差距,”德国普朗克生物化学研究所的纳米技术研究员Ralf Jungmann说,他提到了一种能以原子级分辨率重建蛋白质结构的方法。由Hell领导的哥廷根马克斯普朗克多学科科学研究所的研究小组于2022年底率先在这一领域取得突破,他们开发了一种名为MINSTED的方法,可以通过专用的光学显微镜,以2.3埃(大约四分之一纳米)的精度解析单个荧光标记。新方法使用为常规显微镜提供了可比的分辨率。例如,荣格曼和他的团队在2023年描述了一种策略,其中单个分子用不同的DNA链进行标记。然后用带染料的互补DNA链检测这些分子,这些DNA链暂时但反复地与其对应的靶标结合,使得可以区分个别的荧光“闪烁”点,如果同时成像,这些点将模糊成一个单一的斑点。这种通过顺序成像增强分辨率(RESI)的方法可以解析DNA链上的单个碱基对,展示了标准荧光显微镜的埃级分辨率。

由德国哥廷根大学医学中心的神经科学家Ali Shaib和Silvio Rizzoli领导的团队开发的纳米级扩展(ONE)显微镜方法并未达到这种分辨率水平。然而,ONE显微镜提供了直接成像单个蛋白质和多蛋白复合体的细微结构细节的前所未有的机会,无论是单独呈现还是在细胞中。ONE是一种基于扩展显微镜的方法,涉及将样本中的蛋白质化学耦合到水凝胶基质中,将蛋白质分解,然后让水凝胶体积扩大1000倍。这些碎片在各个方向上均匀扩展,保留了蛋白质结构,并使用户能够用标准共聚焦显微镜分辨出相距几纳米的特征。Rizzoli表示,ONE显微镜可以为动态生物分子构象提供洞察,或者通过血液样本实现蛋白质错误折叠疾病(如帕金森病)的视觉诊断。

细胞图谱

如果你想找一个方便的咖啡馆,谷歌地图可以找到附近的选项,并告诉你如何到达。然而,导航复杂得多的人体内部还没有类似的工具,但各种细胞图谱计划正在取得持续进展——得益于单细胞分析和“空间组学”方法的进步——不久的将来,可能会为生物学家提供他们渴望的组织级别的细胞地图。其中最雄心勃勃的计划是人类细胞图谱(HCA)。这个联盟于2016年由英国汉克斯顿惠康桑格研究所的细胞生物学家Sarah Teichmann和现在是生物技术公司Genentech在南旧金山研究和早期发展部门的负责人Aviv Regev发起。它包括了近100个国家的约3000名科学家,他们使用来自1万名捐赠者的组织。但HCA也是更广泛的细胞和分子图谱努力交汇的生态系统的一部分。这些包括由美国国立卫生研究院资助的人类生物分子图谱计划(HuBMAP)和通过推进创新神经技术(BRAIN)倡议细胞普查网络(BICCN),以及由华盛顿州西雅图艾伦研究所资助的艾伦脑细胞图谱。

斯坦福大学的基因组学家、HuBMAP指导委员会前联席主席Michael Snyder表示,这些工作部分是由于能够在单细胞水平解码分子内容的分析工具的开发和快速商业化的驱动。例如,Snyder的团队经常使用加利福尼亚州普莱森顿10X Genomics的Xenium平台进行其空间转录组分析。这个平台使得每周可以同时调查4个组织样本中大约400个基因的表达。例如,马萨诸塞州马尔堡Akoya Biosciences的PhenoCycler平台等多重抗体基础方法,允许团队跟踪大量蛋白质,并以单细胞分辨率进行3D组织重建。其他“多组学”方法允许科学家同时对同一细胞中的多种分子类别进行分析,包括RNA的表达、染色质的结构和蛋白质的分布。去年,有数十项研究展示了使用这些技术生成特定器官图谱方面的进展。例如,去年六月,HCA发布了49个人类肺部数据集的综合分析。有了肺部的清晰图谱,可以了解肺纤维化、不同肿瘤,甚至COVID-19中发生的变化。2023年,《自然》杂志发布了一系列文章,突出了HuBMAP的进展,《科学》也制作了一个详细介绍BICCN工作的系列。

3D打印纳米材料

在纳米尺度上,可以发生一些奇特且有趣的事情。这可能使得材料科学的预测变得困难,但这也意味着纳米级建筑师可以制造出具有独特特性的轻质材料,例如增强的强度、定制的光或声音相互作用,以及增强的催化或能量存储能力。精确制造这类纳米材料有几种策略,其中大多数使用激光引发光敏材料的有模式的“光聚合”,过去几年中,科学家们在克服阻碍这些方法更广泛应用的限制方面取得了显著进展。其中一个挑战是速度。佐治亚理工学院的工程师Sourabh Saha表示,使用光聚合组装纳米结构的速度比其他纳米尺度3D打印方法快大约三个数量级。这对实验室使用来说可能足够好,但对于大规模生产或工业过程来说太慢了。2019年,Saha和香港中文大学的机械工程师Shih-Chi Chen及其同事展示了他们可以通过使用图案化的2D光片而不是传统的脉冲激光来加速聚合。“这可以将速率提高一千倍,同时仍然保持那些100纳米的特征,”Saha说。另一个挑战是,并非所有材料都可以通过光聚合直接打印,比如金属。但加州理工学院的材料科学家Julia Greer开发了一个巧妙的解决办法。2022年,她和她的同事描述了一种方法,其中光聚合的水凝胶作为微观尺度的模板;然后这些水凝胶被金属盐浸润,并以一种方式加工,使金属承担模板的结构同时也缩小。尽管这项技术最初是为微观尺度的结构开发的,但Greer的团队也将这一策略用于纳米制造,研究人员对用坚固的、高熔点的金属和合金制造功能性纳米结构的潜力感到兴奋。

最后一个障碍——经济性——可能是最难以克服的。据saha称,许多光聚合方法中使用的脉冲激光系统的成本超过50万美元。但更便宜的替代品正在出现。例如,德国卡尔斯鲁厄理工学院的物理学家Martin Wegener及其同事探索了比标准脉冲激光更便宜、更紧凑、耗电量更少的连续激光。Wegener还成立了一家初创公司,以商业化制造纳米构筑金属片的过程,这可能适用于诸如下一代身体装甲或超耐用和抗冲击的飞机和其他车辆的外层等应用。

编译 | 曾全晨

审稿 | 王建民

参考资料

Michael Eisenstein. Seven technologies to watch in 2024. Nature 625, 844-848 (2024)

doi: https://doi.org/10.1038/d41586-024-00173-x

0 人点赞