Judea Pearl提出的「因果阶梯」到底是什么?哥大、斯坦福研究者60页文章详解该问题

2021-06-08 10:29:52 浏览数 (2)

机器之心报道

编辑:小舟

来自哥伦比亚大学和斯坦福大学的研究者从逻辑概率和推理图两方面,对 Pearl 因果层次结构(PCH)和因果推理进行了全面详细的解读。

因果关系对于人类感知和理解世界,采取行动以及理解自己起着核心作用。大约二十年前,计算机科学家 Judea Pearl 通过发现和系统地研究「因果阶梯」(Ladder of Causation),在理解因果关系方面取得了突破,该框架着重说明了观察、做事和想象的独特作用。为了纪念这一具有里程碑意义的发现,人们将其命名为「Pearl 因果层次结构」(Pearl Causal Hierarchy,PCH)。

去年 7 月,来自哥伦比亚大学和斯坦福大学的四位研究者撰写了一篇关于 PCH 和因果推理的技术报告,从逻辑概率和推理图两个方面,对 PCH 进行了新颖全面的解读。日前,Judea Pearl 转发了介绍这篇文章的推特。

该报告首先介绍了 PCH 是如何从规范的因果机制集合(结构因果模型,SCM)中有机出现的。然后文章转向逻辑层面。该报告的第一个结果是因果层次定理(CHT),该定理表明 PCH 的三个层级从测度论的角度上来看几乎总是分离的。粗略地讲,CHT 表明一层的数据实际上不足以确定较高层的信息。由于在大多数实际情况下,科学家无法获得潜在因果机制的精确形式(只能访问他们生成的关于某些 PCH 层的数据),这促使研究者从图的角度来研究 PCH 内部的推理。

文章链接:https://causalai.net/r60.pdf

具体来说,研究者探索了一组因果推理方法,这些方法可以在给定 SCM 部分规格的情况下,将 PCH 的各层进行桥接,以进行推理。例如,当只有被动观察结果(第一层数据)可用时,你会推断将发生的情况会在环境(第二层语句)中遭到干预。研究者提出了一系列图模型,这些模型让科学家能够以认知上有意义且简约的方式来表示 SCM 的部分规格。

最后,研究者探究了被称为 docalculus 的推理系统,展示了在必要情况下,它足以实现 PCH 各层之间的推理。研究者表示:与 PCH 所描绘的人类经验的基本层面相联系是迈向创建下一代 AI 系统的关键一步,该系统将是安全、强大、与人类兼容并符合社会利益的。

文章结构

该报告第一部分包括二、三两节。第二节阐述了 PCH 是如何自然地从结构因果模型中出现的,并通过符号逻辑语言对其各层进行形式化表征,每种符号逻辑语言都可以在 SCM 中进行直接解释。因此,只要一个感兴趣领域可以用 SCM 来表示,则因果概念的层级就已经存在了。

第三节证明了 PCH 对于几乎所有 SCM 都是严格的,这是由「仅使用下层信息执行上层推理一般是不可能的」得出的。该文章第一部分没有直接讨论因果推理的实践,相反,它从逻辑的角度正式建立了因果推理的一般动机。

在该文章第二部分(第四节)中,研究者表示:在许多实际环境中,我们与感兴趣的现象进行交互(观察和试验)的能力充其量也就适度而已,诱导出合理且完全特定的 SCM(图 1.2a)近乎无望。几乎所有的因果推理方法都为自己设定了一个更严格的目标,在不太严格的条件下执行,即仅有基础 SCM 的部分知识可用的情况下。因此,因果推理的问题是,通过对 SCM 的部分理解(图 1.2c),在层次结构的各个层中进行推理(图 1.2b)。从技术上讲,如果具有 layer-1 类型的数据(图 1.2d)(例如通过随机采样收集的数据),并旨在推理一种新干预的效果(layer-2 类型的查询,参见图 1.2e),研究者表明该问题并不总是有解。

换句话说,由于没有在数据集(来自于已认知世界)中编码的 SCM 的足够信息,因此无法了解系统在接受新的干预(未认知的假设世界)时会如何反应。脱离这些不可能的结果,研究者开发了一个框架,该框架可以简约高效地编码一般推理所需的知识(即结构约束)。具体而言,该方法超越了 layer 1 类型约束(条件独立性),并探究了存在于 Layer 2 中的结构约束(图 1.2e)。

研究者使用这些约束来定义被称为因果贝叶斯网络(CBN)的一组新型图模型,该模型由一对图模型以及观察和干预分布的集合组成。研究者为基于 SCM 自然产生的 CBN 提出了一种建设性定义,这也是纯粹实验性的定义。这种处理将现有的表征(characterization)泛化到了 semi-Markovian 环境,并允许存在未观察到的混杂因素。在此背景下,研究者提供了严格基于 layer 2 语义的 do-calculus(Pearl 1995)的新型证明。然后,研究者展示了图结构如何桥接 PCH 的各个层。假定基础结构模型(其形式为因果图)的部分知识与较低层的数据相结合,则有可能在较高层上实现推理。

该报告最后(第五节)总结了主要贡献,并将这项工作放在更广泛的 AI 和数据科学领域中。研究者认为,对 PCH 的固有局限性和巨大可能性进行研究,将极大强化构建安全、稳健、可解释、兼容人类的人工系统的方式。

对 PCH 和因果推理感兴趣的读者,可以阅读文章原文。

0 人点赞