编辑:LRS
【新智元导读】在计算机里以原子级模拟一个活细胞需要多少个「肝」?最近有研究人员创造了一个完整的支原体细胞,还是活的!并且能够在电脑上模拟全部的物理、化学性质,整个模拟时间还不到20分钟!
从原子级开始,亲手创造一个细胞是什么体验?
最近,来自伊利诺伊大学厄巴纳·香槟分校(University of Illinois at Urbana-Champaign)的研究人员成功在原子粒度上模拟了一个最小的活细胞(living minimal cell),使用到的加速设备为Nvidia Titan V和Tesla Volta V100显卡,成功将模拟时间压缩到20分钟内。
研究人员表示,该项目是迄今为止最长、最复杂的细胞模拟。因为原子(atom)是化学反应中不可再分的基本微粒,所以该模拟过程在粒子尺度上能够复制最小细胞的物理和化学特性。
从原子开始创造
提到从细胞开始创造生物,《孢子》(Spore)可以说是绕不过的一个「造物游戏」。
《孢子》游戏由Maxis开发,于2008年发行。游戏让玩家控制一个物种,使之从单细胞开始进化到智慧生命,进而进行空间探索。
游戏一经发行,立刻火爆全球,毕竟谁能拒绝亲手创造出一个高达呢?
Spore把一整个细胞作为初始状态,但实际上细胞也分为很多种类,有不同的物理、化学、生物性质,从原子开始模拟细胞,也许更适合「造物者」的身份。
即使是最小的细胞也包含了20亿个原子,如果让CPU来模拟的话,那不知道要猴年马月才能模拟一个原子的3D模型。
GPU就不一样了,显卡天生就是为并行任务而生,这种并行计算的特性也让GPU在深度学习时代大放异彩。
活细胞物理中心联合主任Zaida Luthey-Schulten表示,只有借助GPU的能力,我们才得以成功从原子级的粒度上建立一个动态的细胞3D模型,这个最小的活细胞包含超7000个遗传信息过程(genetic information process)。研究成果已经发表在了《细胞》(Cell)期刊上。
最小的细胞具有精简的基因组,其中基因组已经被剥离到了只包含最基本的要素,只携带复制其 DNA、生长、分裂和执行大多数其他定义生命的功能所必需的基因,来建立一个反映其行为的细胞计算机模型。
模型能够在原子尺度上绘制出 3D 空间中数千个细胞成分的精确位置和化学特征。它跟踪这些分子扩散通过细胞并相互相遇需要多长时间,它们发生时会发生什么样的化学反应,以及每一步需要多少能量。
为了构建一个最小细胞,来自J. Craig Venter Institute的研究人员选择了一个最简单的活细胞——支原体(mycoplasma),一种寄生于其他生物体的细菌。
这种支原体的构成中只包含不到500个基因,而相比之下,普通的大肠杆菌则有超5000个基因,人类细胞有超2万个基因,所以支原体的模拟相对来说更简单。
在之前的研究中,JCVI团队构建了一个合成基因组,并在富含细胞维持所需的所有营养和因素的环境中培养细胞。对于这项新研究,该团队添加了部分基因以提高细胞的活力。该细胞比任何天然细胞都简单,因此更容易在计算机上建模。
Zaida教授利用先前发现的细胞属性,如氨基酸、脂质和核苷酸来建立脱氧核糖核苷酸(DNA)、核糖核苷酸(RNA)、蛋白质和细胞膜。
模拟像活细胞这样巨大而复杂的东西依赖于数十年研究过程中积累的数据。为了建立计算机模型,研究人员必须考虑细胞DNA、脂质、氨基酸的物理和化学特性,以及基因转录、翻译和蛋白质构建机制。他们还必须模拟每个成分如何通过细胞扩散,跟踪细胞生命周期中每个步骤所需的能量。
通过对支原体进行20分钟的三维模拟,研究人员可以看到支原体在没有细胞繁殖的情况下发生什么事。他们还发现支原体花了大量的时间和精力在细胞膜上移动分子,与作为寄生细胞时的性质一样。并且研究人员能够观察到细胞的氨基酸和核苷酸的主动运输过程,观察活细胞如何平衡生长和新陈代谢,也能够让研究人员了解到细胞的生存规律。
Zaida表示,之所以我们能够在模拟过程中再现细胞中出现的基本行为,并非是因为编程人员把这种行为编码进去,而是因为模型中的动力学参数和脂质机制是正确的。
这些模拟让研究人员深入了解了细胞如何「平衡其新陈代谢、遗传过程和生长的需求」。
例如,该模型显示,细胞利用其大部分能量将必需的离子和分子导入其细胞膜,这是因为支原体从其他生物体中获得了生存所需的大部分物质。
研究人员表示,该模型模拟了一个最小细胞内从其出生到两小时后分裂的所有化学反应。这个最小活细胞的3D、全动态动力学模型打开了一扇了解细胞内部运作的窗口,展示了所有细胞成分是如何响应内部和外部线索相互作用和变化的,将帮助研究人员更好地理解生命的基本原则。
目前研究人员拥有更多的显卡了,开展的新项目涉及到细胞的生长模拟和细胞分裂,使用Nvidia RTX A5000显卡和Nvidia DGX工作站来加速模型的模拟过程,大概可以提升40%的模拟速度。
GPU助力高性能计算
显卡除了打游戏、挖矿以外,由于其在高性能计算(HPC)上的发展,也是推动科学发展的关键工具之一。通过跨多个计算节点利用 GPU 助力的并行处理能力,HPC 能够高效、可靠、快速地运行先进的大型应用程序项目。速度提升后可大幅提升吞吐量并降低成本,从而为科学发现铺平道路。
仿真和建模中涉及到的HPC,广泛用于制药、金融、科研和工程等各行各业,能够应对现实世界的各种疑难杂症。
除了在原子级模拟细胞外,GPU还可以帮助研究人员建立各种复杂病毒的可视化模型,例如COVID19,从而更了解病毒的性质,更快地找到攻克病毒解决方案。
Nvidia还提供用于 HPC 的全套编译器、库和工具,使得开发人员能够利用接口最大限度地榨干GPU的性能。
可视化是高性能计算的一个重要的应用场景,对视频中的每个元素都需要同步预测才能保证特效的真实,不违和。
研究人员正在使用科学可视化从大型 HPC 数据集收集数据,从而将蛋白质折叠进行可视化、分析化学性质、了解超新星等。例如这篇论文中的研究就是通过NVIDIA Omniverse™ Platform构建的细胞模型,并可视化。
创意艺术家也可以将科学数据转化为逼真的视觉效果,帮助研究人员和普通观众更好地理解其艺术背后的科学。
工程师正在使用科学可视化来分析机器人、制造系统和结构工程等各种使用案例的设计。
随着GPU的应用场景越来越广泛,世界对高性能计算的需求也越来越旺盛,老黄和玩家们也终于达成了双赢!
参考资料:
https://www.zdnet.com/article/researchers-use-nvidia-gpus-to-simulate-a-living-cell/
https://www.nvidia.cn/high-performance-computing/scientific-visualization/