对话加拿大工程院于非院士：寻找 AI 领域的「香农定理」

我相信智能是一种自然现象，就像岩石滚动和冰雪融化般自然的现象。——摘自于非著作《智能简史——从大爆炸到元宇宙》。

作者 | 黄楠、青暮

编辑 | 陈彩娴

当科学家把一些菟丝子移植到几株营养状态不同的山楂树上时，那些营养状况更好的山楂树会更容易获得菟丝子的「青睐」。这在以往被看作是植物内「被动」存在的东西，但据研究人员发现，植物也具备从过去的经验中学习区分正负面的经验及教训、进行交流、计算自身处境等等人类所具备的能力。

在其最近新出的《智能简史——从大爆炸到元宇宙》（以下简称「智能简史」）一书中，加拿大工程院院士于非将上述示例视为植物的「智能」。

去年12月在雷峰网举办的 CCF-GAIR 大会上，AI 科技评论曾有幸与于非院士进行了一场深入讨论，不一味强调从「感知」到「认知」的阶段进化，而聚焦当下人工智能的局限性以及智能的科学定义，彼时的于非，仍在为人工智能重新定义寻求可计量的「香农定理」。

定义「智能」科学范式，对人工智能的发展具有重要意义。当时，于非就表示：「科学里面最重要的就是定义。这个东西到底是什么？如果只是文字上的描述，在数学上不是可定义、可量化的话，这个问题就解决不了。」

而在《智能简史》中，于非对理性的数学公式下「智能」定义进行了探索，并指出一条量化智能清晰的新路线。

在很长时间里，「智能」都被视作人类独有的产权，但在于非看来，智能实则是存在宇宙中的一种自然现象，与其他自然现象类似。由于宇宙大爆炸下分布不均的成分带来了各种各样的差异，智能旨在通过调节梯度实现宇宙稳定，从物理、化学、生物到人类、机器甚至元宇宙，智能普遍存在，链接形成了一部发展史。

《智能简史》：定义「智能」

当智能应用的空间扩大，如智慧城市与智能网络形成，单体智能的局限性渐显，科学家们开始求变，从更大的视角思考：什么才是真正的智能？

于非也是这求索队伍中的一员。

于非（F. Richard Yu），加拿大工程院院士、IEEE Fellow、是国际信息和人工智能领域专家，科睿唯安计算机科学领域 “全球高倍引科学家”, 谷歌学术引用量超过 3.3 万。

长期以来，关于「智能的定义」问题一直困扰着于非。

智能的定义未明晰，因此人工智能也还没有成为一门科学，处于工程学阶段，无论是预训练模型、知识图谱还是CNN等概念，都是基于认知科学的启发而提出的。「可以说，人工智能还处于仿生学的阶段。就像在空气动力学发明之前，人们只能仿照蜻蜓和鸟来研发飞行器。」

对此，于非着手进行了大量的研究，意图通过其他学科了解以往对智能的描述，直至「越查越久远，一直查到宇宙从哪里来的大爆炸时期。从大爆炸开始产生了物理世界，就有很多的智能现象。」

1969年，比利时物理化学家和理论物理学家伊利亚·普里高津（Ilya. Prigogine）提出「耗散结构」理论。该理论表明：当包含非线性的多基元多组分多层次的开放系统处于一个远离平衡态的情况下时，系统不断同外界交换物质和能量，系统内某个参量变化达到一定阈值后，就会触发从无序突变为有序状态而形成的一种时间，空间或功能的特殊结构。

经由大规模物质和能量的交换冲击形成新结构，这也印证了化学世界中「智能」「秩序始于混乱」的法则。

当范式踏进生物系统，麻省理工学院的杰里米·英格兰（Jeremy England）教授和团队在「耗散适应」理论中展示了系统通过耗散能量以缓解能量不平衡，在一定条件下，无分子系统自然而然充足，通过化学反应代谢消耗更多的能量，从而促进能量的持续耗散以及「熵」（即宇宙无序状态）的增加。

能量堆积下，结构以最快、最省力的过程迅速缓解不平衡，继而稳定形成了生命，这是过往人们对物理世界、化学世界和生物世界中智能起源的认知学说之一。在其发展历史进程中，「智能」也诞生过无数令人为之感叹的「神秘」现象。

而随着人类科技发展迈进新的社会阶段，需要人们在更大的时间和空间范畴里来思考「智能」的更高级别的表现，但能被称之为科学的「智能」，仍然缺少一个理性的数学公式的定义。

为了寻找一种量化信息的方法，1948年，香农在论文“A Mathematical Theory of Communication”中借鉴热力学概念提出「信息熵」，第一次用数学公式，阐明概率与信息冗余度的关系，使用「熵」来量化信息，对信息时代的成功起了至关重要的作用。

迈进智能时代，以符号主义、联结主义、行为主义为代表的三大学派对「智能」的描述争论不休，即使对质量、能源、信息等重要因素的获取难度降低，但「智能」是对信息的更高层次的抽象，其定义尚未明晰。

于非在《智能简史》一书中指出：智能并非人类的专属，而是同岩石滚落、冰雪融化般普遍存在于物理、化学、生物以及人类、机器（人工智能）乃至元宇宙中的自然现象。智能并不神秘，它是缓解不平衡过程中形成的一种自然现象，使人得以用同样一个逻辑来理解世界如何运转。

与此同时，如何量化智能，对于科学的「智能」至关重要。

1950年，图灵首次提出一个判断机器是否能思考，测试机器是否能表现出与人类相同、或无法区分的智能行为能力的测试，给「可计算性」下了一个严格的数学定义。然而，图灵测试中没有量化的智能度量。

对于如何来衡量智能度量，不少研究人员曾进行过粗略的讨论。但是这些工作都是从心理学、哲学或者工程技术角度出发的，对智能的定义仅限于文字性的描述和探讨，并没有从科学的角度深入探讨智能的本质，更没有从数学上量化智能。

针对这个问题，于非在《智能简史》中探索智能的本质，借鉴了能量和信息的量化思想，开创性给出智能的定义，并首创性地提出了一个可衡量相对智能程度的公式：dL = ∂S/∂R；其中， dL 指智能的变化，S是当前的秩序（order）和预期的秩序的相似，R是一般意义的参数（例如，时间、数据量等），因为智能的变化与多个参数有关，所以在数学上表示是一个多元函数。考虑到多元函数关于其中一个自变量的变化率时，一般用偏导

智能交通神经网络深度学习人工智能自动驾驶

0 人点赞