去年在MeteoAI和气象学家公众号解读过《Nature(2019)-地球系统科学领域的深度学习及其理解》[1],累计阅读量超过1.5w。时隔一年多再回头看地球科学相关的研究动态,你会发现无论是就研究领域还是实际业务之中,深度学习被越来越多的人接纳,特别是年轻的研究生和科学家,在相应的交叉研究中也逐渐地不再把深度学习看成“黑盒子”了,一方面确实有些很好的实际使用效果,另一方面也能够结合数学或者物理机制给出部分解释。那么,下面再来了解一下美国能源部关于物理学家使用深度学习改进地球系统模式的科学新闻。(后文内容均为DeepL翻译,如有不当请多多包涵,可点击文末原文阅读看英文报道。)
Karthik Kashinath,劳伦斯伯克利国家实验室
资料来源:Reichstein, M., Camps-Valls, G., Stevens, B. et al. Deep learning and process understanding for data-driven Earth system science. Nature 566, 195-04 (2019)。https://doi.org/10.1038/s41586-019-0912-1. 典型的深度学习任务(左图)和相应的地球系统科学问题的例子,它们可以应用于:a、图像中的物体识别与气候数据中的极端天气模式的检测有关;b、超分辨率与气候数据的降维有关;c、视频预测与地球系统变量的预测有关;d、语言翻译与动态时间序列的建模有关。
尤其是年轻的科学家,看到了深度学习可以改变科学的游戏规则,他们不希望被落下。他们相信,它很快就会成为主流,它将成为做科学的必要条件。这就是主要的动力。所以AI4ESS专注于教授基础知识,为他们开始将机器和深度学习成功应用于研究打下基础。
深度学习在科学中的作用正处于一个转折点,天气、气候和地球系统建模正在成为物理学信息深度学习的一个令人兴奋的应用领域,它可以更有效地识别大型数据集中的非线性关系,提取模式,模拟复杂的物理过程,并建立预测模型。
"深度学习在一些非常具有挑战性的问题上取得了前所未有的成功,但科学家们希望了解这些模型究竟是如何工作的,以及它们为什么会做这些事情。Karthik Kashinath[2]是美国国家能源研究科学计算中心(NERSC)数据与分析服务组(DAS)的计算机科学家和工程师,他一直深入参与NERSC在该领域的研究和教育工作。"科学深度学习的一个关键目标是如何设计和训练一个神经网络,使其能够准确地捕捉到它所要建模、模拟或预测的过程的复杂性,我们正在开发将物理学和领域知识注入这些神经网络的方法,使它们服从自然规律,其结果是可解释的、稳健的和可信的。"
在地球系统科学人工智能(AI4ESS)暑期学校[3]之后,我们对Kashinath进行了采访,该暑期学校是由美国国家大气研究中心(NCAR)和大学大气研究公司(UCAR)在6月举办的为期一周的虚拟活动,来自世界各地的2400多名研究人员参加了此次活动。Kashinath与NCAR的David John Gagne和Rich Loft一起参与了此次活动的组织和演讲。Kashinath目前的大部分研究集中在深度学习方法在气候和地球系统建模中的应用。
深度学习方法如何在天气、气候和地球系统研究中被采用?
近年来,我们看到深度学习在科学领域的应用显著上升,不仅仅是在增强、提高或替代现有方法方面,还用于发现物理、化学、生物、医学等领域的新科学--这些发现是传统统计方法几乎不可能实现的。我们现在开始看到地球科学领域也有同样的情况,在《地球物理研究快报》和《自然地球科学》等期刊上发表的论文数量不断上升,科学会议现在也有涉及机器和深度学习的整个赛道。
深度学习给我们带来了什么?它在模式识别和发现大型数据集中存在的非常复杂的非线性关系方面非常强大,这两点对于开发地球科学系统模型至关重要。天气或气候建模人员的关键目标是理解自然界中的过程运作方式,并以有效的方式对其进行建模,这样我们就可以预测未来的气候变化和极端天气事件。深度学习提供了新的方法,可以利用现有的数据来了解这些过程的运作方式,并为它们开发模型,这些模型不仅准确有效,而且计算速度比传统方法快得多。传统上,气候和天气模型要解决大型的耦合非线性偏微分方程系统,这是非常耗费计算的。深度学习开始用非常高效和快速的物理过程仿真器来增强、提升甚至取代这些模型的一部分。而这是一个重要的进步。
模式识别是深度学习影响地球系统研究的另一个领域。NERSC的DAS小组一直在大力推动模式识别,用于检测和跟踪大型数据集中的天气和气候模式。2018年戈登-贝尔利用深度学习的超大规模气候分析奖证明了我们在该领域的贡献。鉴于我们已经拥有PB级的气候数据,而且数据还在以疯狂的速度增加,使用传统的统计方法筛选和识别关键特征和模式在物理上是不可能的。深度学习提供了非常快速的方法来挖掘这些数据,并提取有用的信息,比如极端天气模式。
第三个领域是降尺度;也就是说,给定一个低分辨率的数据集,你如何产生非常高的分辨率数据,这对规划等事情是必要的,特别是在区域和地方尺度上?气候科学的部分重大挑战是如何建立准确的高分辨率模型,并产生我们可以可靠使用的数据。攻克这个问题的一种方法是说,好吧,我们知道这些模型非常昂贵,在可预见的未来--即使计算速度越来越快,越来越好--我们真的无法建立可靠的1公里或更细的空间分辨率的全球气候模型。因此,如果我们能够创建一个深度学习模型,利用低分辨率的气候数据,并产生具有物理意义、可靠和准确的高分辨率数据--这将改变游戏规则。
深度学习应用于地球系统科学的大挑战是什么?我来自流体动力学的背景,其中建模湍流是一个长期的大挑战。大气科学中类似的挑战是对云的建模。所有气候模型都有参数化--气候模型中描述各种物理过程如何行为和相互作用的组件。在大气中,这包括云是如何形成的,辐射是如何工作的,降水是何时何地发生的,等等。众所周知,云模型也是气候模型预测中最大的不确定性来源,几十年来,最大的挑战之一就是如何降低不确定性。模型已经变得更加复杂,并且捕获了更多的物理现象,但它们的预测仍然存在很大的不确定性。因此,深度学习可以产生重大影响的一个领域是帮助我们建立更好的大气过程(如云)的仿真器,目标是减少预测的不确定性。这是一个非常具体的科学目标。
展望未来,在深度学习对气候和地球系统研究的影响方面,你最兴奋的是什么?我们从科学界得到的主要反驳是,神经网络是很难理解和解释的黑盒子,科学家们显然希望了解这些神经网络究竟是如何工作的,以及它们为什么会做这些事情。因此,我非常兴奋的一件事是开发更好的方法来解释和理解这些网络,并将我们所拥有的关于地球系统物理学的知识融入到这些模型中,使它们更加稳健、可靠、值得信赖、可解释、可解释和透明。我们的目标是让我们自己相信,这些模型的行为是尊重自然界的物理学的,是在有效地利用我们所拥有的领域知识,并且是在做出我们可以信任的预测。我应邀向《英国皇家学会论文集》提交了一篇论文,正是关于这个主题,"Physics-informed Deep Learning for Weather and Climate Modeling",现在正在审阅中。
我也很兴奋,在操作中证明,当我们将这些深度学习模型嵌入到一个大型气候或天气模型中时,这些深度学习模型可以提供我们宣称的计算速度。例如,欧洲天气预报中心已经开始用机器和深度学习模型替换其天气预报模型的某些部分,他们已经开始看到效益。在美国,NCAR和国家海洋和大气管理局也开始用机器学习和深度学习模型替换部分气候和天气模型,一些学术界和工业界的研究小组也在开展相关项目。Chris Bretherton是世界顶尖的气候科学家之一,他领导着华盛顿大学的一个小组,该小组正致力于用深度学习方法取代这些大型气候模型中的一些复杂云过程。所以我很期待一两年后看到他们在速度和性能上的成果。
AI4ESS活动的重点是什么,为什么参加的人这么多?
地球系统科学人工智能(AI4ESS)暑期学校的重点是与会者如何加强他们在统计和机器学习方面的背景,学习深度学习和神经网络的基础知识,并学习如何使用这些知识解决地球系统科学中的挑战性问题。我们对学校的反应非常热烈--这本来是在科罗拉多州博尔德市举行的一次亲身活动,可容纳80名学生。但一旦进入虚拟状态,我们有来自全球40个国家的2400名与会者。活动通过UCAR进行直播,他们跟踪了每天的登录情况。
整个星期的参与度很高。我们每天都有受邀的演讲者--每天三场讲座,所以一周内有15场讲座--来自机器学习、深度学习和地球科学的专家。每天午餐时还会有30分钟的小组讨论,对我来说,这些都是超级激动人心的,因为所有这些专家都在讨论和辩论关于将机器学习和深度学习用于地球系统科学的挑战和机遇。学校还举行了为期一周的黑客马拉松活动,六人小组分别从六个不同的问题中选择一个项目进行一周的工作。大约有500人参加了黑客马拉松,大家进行了大量的合作和互动,包括每个黑客马拉松团队的个人Slack频道。整个夏校一周也有Slack频道,内容包括:讲座相关的问答、黑客马拉松挑战问题、机器学习和深度学习的技术技巧等。所以Slack的活动非常多,大家在交流想法,分享成果等等。
为什么大家这么热衷于学习这些东西?我认为社区,尤其是年轻的科学家,看到了深度学习可以改变科学的游戏规则,他们不希望被落下。他们相信,它很快就会成为主流,它将成为做科学的必要条件。这就是主要的动力。所以AI4ESS专注于教授基础知识,为他们开始将机器和深度学习成功应用于研究打下基础。
NERSC位于劳伦斯伯克利国家实验室,是美国能源部科学办公室的用户设施。
参考资料
[1]
Nature(2019)-地球系统科学领域的深度学习及其理解: https://mp.weixin.qq.com/s/HejaVRo1Z6-rrdi2UDnM7A
[2]
Karthik Kashinath: https://www.nersc.gov/about/nersc-staff/data-analytics-services/karthik-kashinath/
[3]
地球系统科学人工智能(AI4ESS)暑期学校: https://www2.cisl.ucar.edu/events/summer-school/ai4ess/2020/artificial-intelligence-earth-system-science-ai4ess-summer-school