Nat Rev Phys | 论人工智能的科学理解

编译 | 刘名权审稿 | 陈睿哲

本文介绍一篇来自于加拿大多伦多大学人工智能Vector研究所的Mario Krenn等人发表在Nature Reviews Physics上的综述——《On Scientific Understanding with Artificial Intelligence》。

毫无疑问，设计出一个能正确预测每一个粒子物理学实验的结果、每一个化学反应的产物或每个蛋白质功能的oracle是一次科学的革命性巨变。但科学家并不满足于此，他们更想要了解这些oracle是如何做出这些预测。这也就是所谓的科学理解，是科学的主要目标之一。随着算力的提升和人工智能的进步，一个自然的问题出现了：先进的计算系统，特别是人工智能，如何能够促进新的科学理解或自主地获得科学理解？为了回答这个问题，作者采用了科学哲学中对“科学理解”的定义，概述关于这个主题的相关文献，并结合科学家的几十个观点，绘制出计算机辅助科学理解的三个维度。

科学理解

首先我们需要了解什么是科学理解。前面提到，科学家希望“能够掌握预测是如何产生的，并在具体的情况下对其结果产生感觉”。通俗地说，作者把这个目标称为“理解”，但这到底是什么意思？众多哲学家给出了他们的见解：“理解”与①建立因果模型的能力有关（例如，Lord Kelvin说：“在我看来，检验我们是否理解物理学中的某一主题的标准是，我们能否为它建立一个机械模型”），②与提供可视化有关（Anschaulichkeit和他的拥护者们这样命名，或则说③理解对应于提供一个统一思想。

最近，Henk de Regt和Dennis Dieks提出了一个新的科学理解理论，它既是背景性的，也是实用性的。他们发现，诸如可视化或统一化的技术是“理解的工具”，从而在一个总体框架中连接了以前的想法。他们的理论并不要求知道具体的“工具”，这使得它在多样的科学学科应用中非常有用。该理论背后的主要动机是，“一个令人满意的科学理解的概念应该反映实际（当代和历史的）科学的实践”。简单地说，他们认为。"如果存在一个关于P的可理解的理论T，使科学家能够在不进行精确计算的情况下认识到T的定性特征结果，那么一个现象P就可以被理解。

理解现象的标准：如果存在一个关于P的理论T是可理解的，那么一个现象P可以被理解。
理论的可理解性标准：一个科学理论T对科学家来说是可理解的（在语境C中），如果他们能认识到T的定性特征后果而不进行精确计算。

作者使用这个具体的理论，因为它可以用来“实验性地”评估科学家是否“理解”了新的概念或想法，而不是通过检查他们的方法，只看科学结果和后果。

科学发现和科学理解

科学理解和科学发现都是科学的重要目标。两者的区别在于，没有新的科学理解，也可能出现新的科学发现。

作者给出了几个例子。例如：最近在蛋白质折叠方面由ML促成的突破无疑将改变生物化学的格局。然而，到目前为止，AlphaFold一直是一个黑盒模型，即它并没有直接提供de Regt和Dieks意义上的新的科学理解；此外，物理学中的许多发现发生在其理论或解释之前(有时是很久之前)。这些理论或解释提供了科学的理解。例如：包括发现超导性(及其高温版本)的发现、宇宙微波背景的发现、中微子振荡和夸克型发明前的粒子动物园的发现。

在过去的几年里，在人工智能和自然科学之间工作的科学家一直在尝试用机器来重新发现物理规律或概念。这方面的例子包括日心世界观、时间箭头（arrow of time）或机械运动方程。这些应用是很好的基准，表明这些算法在大体上是可行的。然而，问题是，一个能够重新发现物理定律和概念的人工智能是否也能够为新的科学理解做出贡献。作者认为，这并不能保证。因为这些人工智能系统的人类创造者知道他们在这些案例研究中寻找的是什么。目前还不清楚如何避免在代码或数据中的有意识和无意识的偏置(在最广泛的意义上，例如，通过选择特定的表征) 。因此，即使一个算法能够重新发现有趣的物理现象，也不清楚是否以及如何使用它通过发现新的科学思想来推动科学的发展。为了超越重新发现的任务，人们需要明确地关注如何获得“新”的科学理解的问题。宽泛地说，从先进的计算系统中获得新的理解意味着发现新的想法、原理、概念甚至理论，科学家们可以在不同的情况下应用和使用这些发现，而不需要进行（完整的）计算。

计算机辅助理解的三个维度

人工智能系统可以通过三种方式为新的科学理解做出贡献（如下图所示）。首先，作为一个“计算显微镜”，它可以提供通过实验手段得到无法(尚未)获得的信息。第二，作为一个灵感资源，扩大人类想象力和创造力的范围。第三个维度是，人工智能是一个“理解的代理人”，在概括观察和将这些新的科学概念转移到不同的现象中时取代人类，并且—重要的是—将这些见解传达给人类科学家。

计算机显微镜

显微镜也许是最著名的仪器,它可以调查肉眼看不见的物体和现象。同样地，计算显微镜也能对物体或过程进行调查，这些物体或过程不能以任何其他方式可视化或探测，例如，在实验中无法获得的长度和时间尺度上发生的生物、化学或物理过程。

计算机显微镜能否进一步改进？作者讨论了两个活跃的方向。首先，更先进的计算系统将允许对越来越复杂的物理系统进行分析。第二，以一种更易解释的方式来表示信息，将有利于科学理解的提取。

日益复杂的系统

一个重要的研究方向是提高计算机模拟的复杂性和准确性。例如，增加模拟系统的规模、模拟的时间尺度和可以相互作用的数量。这些将大大增强模型研究复杂动态系统的能力。一般来说，这种进步可以通过算法或硬件的改进来实现，或者两者都有。在这方面，作者预测人工智能技术与先进的硬件，如GPU、TPU甚至OPU将产生巨大的影响。此外，量子化学和物理学的实验性量子计算的进展表明，基于量子力学的全新算法将在这个领域发挥重要作用。算法的改进可能涉及到模拟过程中的自适应和智能分辨率以及先进的可视化方法，这直接带来了未来发展的第二个方向。

先进的数据表示

在计算机辅助理解的第一个维度，人类科学家应该对来自计算显微镜的新数据进行泛化。因此，作者认为，数据表示的进步可以极大地帮助人类掌握基础结构，促进新的科学理解。科学家们目前主要是在(可能是动画的)二维图形表示中分析数据。我们相信，真正的3D环境(通过虚拟或增强现实眼镜或全息技术实现)将大大有助于对复杂系统或复杂数据的理解。此外，时间维度可以用来表示更多的结构化数据；例如，通过视频（3D视频）。另外，声音也可以作为一个额外的数据维度，因为人类的听觉在检测（周期性）时间相关数据的结构或对称性方面非常出色。一个强大的算法可能能够识别基础数据中的对称性，并将其投射到带有声音的三维视频中，这可能有助于人类的识别并随后理解计算显微镜所产生的数据中的新属性。

灵感来源

令人惊讶和有创意的想法是科学进步的基础。计算机算法可以系统地激发这种想法，从而大大加快科学和技术的发展。早在70年前，Alan Turing就指出：“机器经常让我感到惊讶”。因此，作者认为人工智能可以成为隐喻意义上的科学的人工灵感。接下来，作者将概述计算机算法能够为新的科学思想提供灵感来源的一些方法。

识别数据中的惊喜

从实验或模拟中获得的异常数据或意外的规律性可以引发新的想法和概念。作者的调查显示，这些特殊点通常是由人类来识别的。

举个例子，这个例子涉及到高压物理学中晶体结构的一个意外阶段。作者发现了一个出乎意料的稳定配置，即交替出现的NH2和NH4层，而不是稠密的NH3。他们将这一现象概念化为自发电离，这是一个在酸碱化学中常见的过程，现在NH3的高压相图中是一个被广泛接受的现象。物质高压行为中的自发电离已经成为一个更加普遍的原则，无需进行任何模拟就可以使用。

与该例子相比，数据异常可能表现为更多的变量组合，这对人类来说可能是非常难以把握的。因此，应用先进的统计方法和ML算法来解决这类问题将是未来的一个重要研究方向。在自主异常检测方向上的卓越工作已被应用于科学数据，比如来自于欧洲核子研究中心的大型强子对撞机（LHC)的数据。这种技术有望发现新的物理学特征，然后可以由人类物理学家来构思和理解。另一种有趣的检测异常值的技术，曾用于发现量子相位，就是撇开一个(或一些)训练实例，观察神经网络的结果。

估算预测的置信度将是另一种直接搜索数据中异常情况的方法。或者，一个能够构建新的科学假设的人工智能可以发现标准统计方法无法辨别的异常值或意外模式。

如果人工智能能发现以前的科学数据被人类忽视的隐藏的模式或不规则性，这可能得到新的想法，并最终产生新的概念理解。截至目前，作者还没有发现这种情况。

识别科学文献中的惊喜

基本上每一个科学领域的科学论文的数量都在极大地增长。因此，研究人员必须专注于更小的学科分支，导致我们很难发现跨领域的想法。作者预测，在未来，我们将使用计算机自动化利用科学文献，并识别出卓越并且惊人的工作用于进一步调查。

实现该目标的一个有前景的方法是通过无监督学习对大量科学文献语料库进行编码。在该技术中，科学文献的内容被转化为一个高维的向量空间。这种方法已被用于材料科学领域，并重新发现了核心科学概念，如元素周期表。另一种方法旨在从大量的科学文献中建立语义知识网络。在这些网络中，科学概念是结点，而边则携带关系信息。在最简单的情况下，这意味着两个科学概念在同一篇科学论文中被提及。因此，科学知识被表示为一个不断发展的网络，它可以被用来识别科学文献中的已开发和未开发的区域。这种类型的网络被用于生物化学，以确定有效的全球研究战略。人工智能方面的进展技术可以大大改善这种类型的系统。例如，自然语言处理，如BERT。或GPT-3可以帮助我们从研究论文中提取更多的科学知识，而基于大规模图的图神经网络可以从语义网络中改善对新研究课题的预测。

通过检查模型获得令人惊喜的概念

作者还期望通过对人工智能算法的学习过程给出一个合理化的解释，以解决特定的问题，换言之，可解释的人工智能。实现这一目标的一个想法是受到DeepDreaming的启发，这是一种最早用于计算机视觉的方法。一个显著的应用是神经网络中的“变量解耦”。其目的是了解神经网络已经学会的内部表征。比如，用地心坐标表示的天文数据来训练一个神经网络，而变量解耦使得通过模型的内部表示重新发现了日心坐标。在物理领域中，通过使用决策树的梯度提升，特征的重要性被用于解释分子和量子光学电路的特性。尽管不是在科学领域，一项研究调查了下棋的人工智能AlphaZero对国际象棋的理解，以及类似人类的知识是如何在其内部进行编码。所有这些工作中重新发现的概念都不是新的，因此，未来最重要的挑战是学习如何提取以前未知的概念。

来自可解释解决方案的新概念

与其说科学家从人工智能算法中获得灵感，不如说他们提供的解决方案也会让人感到惊讶。当解决方案以可解释的方式表示时，它们可以带来新的想法和概念。可解释的表示方式的一个例子是数学公式。因此，科学家们可以检查由计算机算法得出的公式，直接解决数学问题，并且衍生出更普遍的解决策略。

天文学中最近的一个具体例子是，通过过去30年对太阳系行星和卫星的实际观测数据，重新发现了牛顿的引力定律。利用图神经网络能进行高质量的预测。有趣的是，除了运动方程，该方法还同时正确预测了行星物体的质量。

另一个例子出现在量子光学领域。其中，一个人工智能算法用图论表示量子光学设置，为以前未知的量子系统设计配置。最终的解决方案以一种物理上可解释的图形理论表示出来。在该过程中，人类科学家可以快速地解释解决方案工作的根本原因，并将其应用于其他环境，而无需进一步计算。因此，开发可解释的表述和方法来提取其他领域的基本概念将是未来的一个重要研究方向。

探测人工智能的行为

采取行动的算法，如遗传算法或强化学习代理采用政策略来搜索问题空间。人类科学家可以观察它们如何搜索这个空间，而不是遵循一个严格的外部奖励。例如，最大化一个物理系统的特定属性。人工代理不是直接最大化某些功能，而是试图学习和预测环境的行为。然后，它选择导致它不能很好预测的情况的行动，从而最大限度地提高它自己对环境的理解。在模拟的虚拟世界中，使用好奇心策略的代理和在真实的实验室中使用机器人代理，已经表明好奇心是一种有效的探索策略。人工代理的其他内在奖励是“计算创造力”和“惊喜”。这些内在奖励可以产生特殊的、出乎意料的解决方案和代理行为，最终激发人类科学家的灵感。

理解代理

第三个维度是能够自主地获得新的科学理解的算法，并最终向人类解释这些见解。Donald Michie在1988年的开创性工作“未来五年的机器学习” 中，已经讨论了机器将见解转化为人类的想法。Michie将人工智能算法分为三类:弱ML、强ML和超强的ML。弱ML以更大的训练数据量实现了预测质量的提高。可以说，今天的大多数ML方法都属于这一类，在这种情况下，算法被当作一个黑盒子。强ML方法要求提供其假设的符号表示，例如，通过布尔（逻辑）表达式或数学方程式。最后，超强的ML方法要求算法教授人类操作者，从而使人类的表现与人类单独从数据中学习相比得到改善。

超强ML和第三个维度，即理解代理有关。两者都要求机器获得新的见解，并将其传授给人类。Michie要求以符号的方式传递见解，而理解代理则更加灵活，允许任何教学方法，例如，通过自然语言进行讨论，如GPT-3。此外，该代理需要提供新的科学理解(在de Regt的严格意义)，而不仅仅是解释或诠释。因此，理解代理在技术实现方面更加灵活，但在教给人类的东西方面更加严格。

首先，找到“新”的科学理解是取决于背景的。什么是新的取决于我们是否考虑个别科学家和他们的专业领域、一个科学领域、整个科学界。甚至是整个历史上的科学努力。因此,真正的理解代理必须能够评估见解是否是新的，至少在需要获得该科学领域知识的特定科学领域的背景下。

其次，de Regt强调了基础科学理论的重要性，这些理论使我们能够认识到有质量特征的后果。仅仅使用ML等先进的统计方法对数据点进行插值或预测新数据是不够的。因此，即使这种方法可以近似于复杂而昂贵的计算，神经网络的应用也不能成为理解的媒介。科学理解需要的不仅仅是单纯的计算。

因此，作者提出科学理解的两个充分条件：

如果一个人工智能能够在不进行精确计算的情况下认识到某一理论的定性特征后果，并在新的背景下使用它们，那么它就获得了科学理解；如果一个人工智能能够将其理解转移给人类专家，那么它就获得了科学理解。

科学理解测试

科学理解测试。一个人(学生)与一个老师互动，这个老师可以是人，也可以是人工科学家。老师的目标是向学生解释一个科学理论及其定性的、特征性的后果。另一个人(裁判员)对学生和老师进行独立测试。如果裁判员不能分辨出学生和老师在各种情况下的解释的质量，那么我们认为老师有科学理解。

该测试的定义意味着人类需要理解人工智能设计的新概念。如果一台机器真正理解了什么，它应该能够解释它并将理解转移给其他人。作者认为，这应该总是可能的，即使此时的理解远远超出了人类专家的认识。请注意，随着人类和人工科学家的能力之间的差距越来越大，人工智能将其理解转移给人类将变得越来越有挑战性和耗时。此外，人类和计算机之间的科学讨论可以通过使用自然语言处理工具的高级查询来实现，如BERT或GPT-3。

总结

毫无疑问，一般来说，先进的计算方法，特别是人工智能，将进一步彻底改变科学家探索世界秘密的方式。作者概述了这些新方法如何能直接促进获得新的科学理解。在未来，要想进一步促进人工智能获得科学理解，需要自然科学家、计算机科学家和科学哲学家之间的多学科合作。因此，我们坚信，这些研究工作能够—在我们的有生之年—将人工智能转变为真正的理解代理，直接促进科学的主要目标之一，即科学理解。

参考资料

Paper: Krenn, M., Pollice, R., Guo, S.Y. et al. On scientific understanding with artificial intelligence. Nat Rev Phys (2022).

https://doi.org/10.1038/s42254-022-00518-3

人工智能深度学习编程算法神经网络

0 人点赞