尽管数值天气预报(NWP)已经取得了几十年的努力和进步,但极端天气事件仍然具有挑战性。现代天气预报使用大气和海洋的数学模型来根据当前的天气状况预测天气。即使现在超级计算机的能力越来越强,数值天气模型的预测能力也只能维持6天左右,尽管它与地点、季节和天气模式的类型有一定的关系。
持续的天气模式往往是极端事件的驱动因素,尤其难以预测。使用NWP改进此类事件的预测需要使用更高分辨率的模型,并从几乎相同的天气条件开始运行更多的模拟。后者需要解决大气的混沌本质,即,著名的蝴蝶效应。然而,更高的分辨率模型和更多的模拟需要大量的计算资源。
深度学习是人工智能的一种形式,在这种人工智能中,计算机被训练来做出类似于人类的决策,而无需对它们进行明确的编程。卷积神经网络是深度学习的中流砥柱,擅长模式识别,是自动驾驶汽车、面部识别、语音转录等数十项技术进步的关键技术。
助理教授Pedram Hassanzadeh在机械工程和地球环境和行星科学莱斯大学,和他的博士生Ashesh将Ebrahim Nabizadeh,最近推出了一个数据驱动框架:1)制定极端天气预测作为一个模式识别问题,和2)采用最先进的深度学习技术。他们的发现发表在2020年2月版的美国地球物理联盟的《地球系统建模进展杂志》上。
深度学习是人工智能的一种形式,在这种人工智能中,计算机被训练来做出类似于人类的决策,而无需对它们进行明确的编程。卷积神经网络是深度学习的中流砥柱,擅长模式识别,是自动驾驶汽车、面部识别、语音转录等数十项技术进步的关键技术。
数据驱动框架的优势在于,一旦对观测和/或高分辨率数值模型数据进行了训练,它就可以以很少的计算成本提供相对准确的预测,这可以通过提供早期警告来补充和指导其他NWP工作。
一般来说,数值天气模型在预测天气方面做得很好,但它们在极端天气方面仍然存在一些困难。“我们正在尝试用一种非常不同的方式来预测极端天气。”
作为一个概念验证,哈桑扎德和他的团队预测了北美上空的热浪和寒流,他们使用了有关海拔5公里左右的大气环流的有限信息,在某些情况下,还使用了几天前的地表温度。
他们的演示结果表明,极端天气预测可以作为一个模式识别问题来完成,特别是最近在深度学习方面的进展。事实上,研究人员发现,更先进的深度学习方法比更简单的方法效果更好,这表明开发适合气候和天气数据的深度学习方法有潜在的好处。
莱斯大学工程师为预测极端天气事件而创建的胶囊神经网络的示意图。资料来源:Mario Norton/Rice大学数字媒体公地。
我们发现由于天气模式的相对位置在他们的进化起到关键作用,使用更先进的深度学习方法跟踪特性的相对位置提高了准确性和也更健壮的时候我们没有大量的数据训练,”Hassanzadeh说。
有趣的是,模式匹配是人们在二战之前和期间开始进行天气预测的方式。在那个时代,人们仅仅触及了今天可能发生的事情的表面。甚至将一个方程积分到天气系统中,这是数学模型的第一步,也是不可能的。
在此期间,人们通过查看天气模式和模式匹配的目录来进行天气预测,这被称为模拟预测。但二战后,随着计算机的普及,气象学家们放弃了这种方法。
模拟技术是一种复杂的预测方法,它要求预报员记住一个即将发生的天气事件。这是一项很难使用的技术,因为在未来很少有一个完美的事件模拟。它仍然是观测海洋降雨以及预测降雨量和降水分布的一种有用方法。
“在这篇论文中,我们展示了通过深度学习,你可以用非常复杂的天气数据进行模拟预报——这种方法有很大的潜力。”
为了得到结果,研究人员分析了大型数据集,并在德州高级计算中心(TACC)和匹兹堡超级计算中心的超级计算机上使用了机器学习代码。每个数据集的大小都是几个tb。此外,他们使用了国家大气研究中心的超级计算机已经产生的数据作为深度学习模型的输入。
“如果没有XSEDE的计算资源,我们的工作就不可能完成。Stampede2、Wrangler和Bridge使我们能够完成这项工作。我们在Rice有补充系统,但Stampede2是我们团队使用的主要超级计算资源,Bridge使我们能够有效地处理非常大的数据集。”
XSEDE是国家科学基金会资助的极端科学和工程发现环境,一个集成和协调先进的数字服务和资源共享以支持科学的虚拟组织。
根据Hassanzadeh的说法,越来越多的天气和气候领域的人对深度学习如何帮助改善气候和天气模型感兴趣。
"我认为我们正在向人们展示这种方法是有效的。”他说:“我们小组的下一步工作是研究深度学习是否比日常天气预报中使用的操作性数值天气模型更准确。我们也许能够利用观测数据训练神经网络,它可能比你从预测极端事件的数值天气模型中得到的效果更好、更准确。我们将重点讨论提前时间较长的预测,因为数值模型的性能很差。如果成功,这将是天气预报的一大进步。”
这项名为“利用深度学习模拟预测极端天气模式”的研究发表于2020年1月的《地球系统建模进展杂志》(JAMES)上。这项研究的共同作者是莱斯大学的Ashesh Chattopadhyay、Ebrahim Nabizadeh和Pedram Hassanzadeh。这项研究由NASA拨款80NSSC17K0266和来自国家科学院、工程院和医学院海湾研究项目的早期职业研究奖学金资助。计算资源由TACC和PSC在国家科学基金会支持的XSEDE项目和Rice的计算研究中心与Ken Kennedy研究所合作提供。