论文介绍:
在这里,我们旨在通过推进全球神经元工作区的扩展(预测性全球神经元工作区(PGNW))来克服这些限制,该工作区将 GNW 的基本方面与更近期的(贝叶斯)主动推理方法相结合,以理解大脑功能。具体来说,我们提出了一个基于主动推理的视觉意识的层次化、部分可观察的马尔可夫决策过程(POMDP)模型。重要的是,我们利用与主动推理相关的神经过程理论,在神经生物学和模型提供的模拟之间建立明确的联系。
首先由霍维(2013)、威特(2019)和弗里斯顿等人(2012)引入的形式化概念, 我们将认为有意识的接近或“点燃”是一个基本的推理过程,它依赖于足够时间深度的处理水平,以将较低水平的处理联系起来并进行协调。这种较长时间的协调被认为是生成主观报告所必需的。在这里,主观报告是一组更广泛的临时扩展行动计划(即,扩展的行动序列)的一个例子,其生成需要在足够长的时间内对信息进行整合、维护和处理,并且该信息足够复杂,足以指导这种目标导向行为的受控生成。
例如,组合与诸如“我”、“看见”、“一个”、“红色”和“正方形”之类的词相关联的概念内容需要表示比表示由词“红色”表示的感知属性所需的更大的抽象和时间深度的内容。
建立在前面提到的这个领域的概念上的贡献,我们用一系列详细的计算模拟来证实我们的论点。这些模拟是基于主动推理提供的感知和行动选择的基本原理。我们展示的模拟也是使用标准例程实现的(可通过开放访问获得;见软件说明),这将允许读者复制我们的结果,并为自己的目的定制这些模拟。这些模拟提供的原理证明在理解神经元过程时特别重要,这些神经元过程实现了基于 GNW 公式的有意识接近的信念更新。
正如我们将要展示的,手头有一个电子实验对象可以让我们证明,在当前关于视觉意识的神经科学研究中,大量不同的发现是如何被大脑功能的第一原理解释的。
我们通过模拟表明,该模型可以:1)统一以前看似矛盾的结果;以及 2)再现由GNW 预测的四向分类法的基本方面,描述有意识接近、注意力和刺激强度之间的关系。使用相同的生成模型架构,我们随后再现了 Pitts 等人(2014 年)提出的无意视盲范式的电生理和行为结果(并对此提供机械解释)。
接下来,我们转向预期在视觉意识中的作用,并展示我们的模型如何扩展 GNW 理论的原始四向分类法,以包含在逐个试验的基础上操纵先前预期的范式——突出从这种扩展中出现的新预测。我们还描述了一个新的范例,它可以用来测试关于期望、注意力和刺激强度的可分离效应的不同模型预测。我们通过检查 PGNW 和替代模型之间的关系来结束,并简要地解决关于现象意识如何可能合理地位于我们的模型中的潜在问题。然而,本文主要关注的是 Block (2005)所定义的“进入意识”,它被定义为用于口头报告、自愿行动和执行处理的信息的可用性
2.1 在分析的计算层面上,这里描述的自由能信念更新机制对于定量地解释感知和行为选择是必要的。至关重要的是,正如我们将在后面看到的,自由能这种信念更新方案的神经元实现的许多方面已经得到了很好的确立(至少在更粗粒度的描述水平上),并在放电率和突触功效的相关测量方面提供了新的预测。
我们将生成模型公式化为部分可观察的马尔可夫决策过程(POMDP 参见图 1)。POMDPs 对潜在变量和它们生成的观察值之间的离散转换进行建模。这种模型基于不同隐藏状态因素和不同观察(或结果)模态之间的(可能性)映射来推断状态和政策——由一组 A 矩阵(每个结果模态一个矩阵)给出。状态之间的转换由一组 B 矩阵(每个状态因子至少一个矩阵;请参见下面的策略选择描述)。一组 C 矩阵描述了代理人在每个时间点对观察的优先选择(每个结果模态一个矩阵),并量化了代理人喜欢或反对特定观察的程度。最后,关于初始状态的先验信念由一组 D 向量(每个隐藏状态因子一个)确定。a、B、C 和 D 各自是在它们各自的参数空间上具有狄利克雷先验的分类分布。
(Such models infer states and policies based upon the (likelihood) mapping between different hidden state factors and distinct observation (or outcome) modalities – given by a set of A matrices (one matrix per outcome modality). Transitions between states are determined by the transition probabilities encoded by a set of B matrices (at least one matrix per state factor; see description of policy selection below). A set of C matrices describes the agent’s prior preferences over observations at each time point (one matrix for each outcome modality) and quantifies the degree to which agents prefer, or are averse to, particular observations. Finally, prior beliefs about initial states are determined by a set of D vectors (one per hidden state factor). A, B, C and D are each categorical distributions with Dirichlet priors over their respective parameter spaces.)
这种模型配备了可选择的可允许的动作序列(计划或策略;π),其中每个可能的序列被分配一个值(较高的策略值与较低的预期自由能 G 相关,相对于编码在 C 中的优先选择来定义)。在这类模型的上下文中,可允许的策略被指定为可允许的状态转换的序列,其中对于给定的状态因子,每个时间点的每个可允许的转换(动作) 由不同的 B 矩阵编码。因此,动作对应于代理对状态转换的直接控制。观察和隐藏状态被分解成单独的结果模态和隐藏状态因子,以允许在似然映射(A)中隐藏状态之间的交互。在分层模型中,如本文所采用的模型,第一层的隐藏状态作为第二层的观察值(见图 1)。至关重要的是,层次模型还允许对深层时间结构进行推断。一个直观的例子是阅读,其中模型的第一层可以推断单个单词,而第二层可以推断较长时空范围内单词序列所包含的叙事意义(见 Friston 等人,2017 年)。例如,在任务的单次试验的时间尺度上,信念更新等同于(例如,感知)推理,而在更长的时间尺度上,更新导致学习(我们向对数学感兴趣的读者推荐 Da Costa 等人,2020a)。从技术上讲,推理指的是更新关于隐藏状态的信念,而学习对应于更新由上述矩阵指定的生成模型的参数(关于该参数的信念)
2.2 视觉意识的深层时间模型为了模拟有意识和无意识感知之间的差异,我们基于 Pitts 及其同事(2012,2014a,2014b)介绍的范式进行了模拟任务。我们选择这项任务是因为,只需对设计进行微小的修改,该范式就可以用于研究疏忽性失明和现象掩蔽,从而使我们能够以一种经验上似乎合理的方式对注意力和感官信号强度之间的相互作用进行建模。
在我们的模拟任务中,每次试验开始时,电脑中的受试者(或代理人)都会看到一个由一排被彩色圆盘包围的长条组成的刺激。在第 2 个时间点,条形的阵列被正方形替换,在第 3 个时间点,阵列变回条形的集合。然后要求代理人自我报告他们是否看到了正方形或执行两个选项的强制选择任务。我们通过要求代理监控周围圆圈的颜色(红色或黑色) 来操纵注意力,而牺牲了内部阵列(见图 2)。
4.1 深层时间结构的作用有意识接近的定义(可测量)特征是主观报告(Baars,1988;Dehaene,2014; Fleming,2019),这需要知觉、运动和听觉-语言系统之间的处理协调,所有这些系统都在快速的时间范围内进化。我们的模型的核心概念是,有意识的接触是一个基本的推理过程,它只能发生在一个处理水平上,这个处理水平在时间上足够深入, 可以整合来自较低层次的信息,并在这些较低层次上进行情境化处理。为了产生主观报告,系统必须推断较低水平的感知系统的状态,将该信息整合到不受限于逐时刻的感觉流量的表示中,并使用该表示来调整更受控的、随时间缓慢发展的动作轨迹。换句话说,在不同的目标状态下,随着时间的推移,在较低层次的感觉和运动表征中,时间上更深层次的编码模式是必要的。如果没有一个感官表征在这个更高的水平上更新预测的协方差模式(达到足够的程度),在更高的水平上进行的更复杂的认知过程对那条感官信息的使用将受到很大的限制(即,仅通过更高水平后验分布中的小变化来促进隐含偏差)。从技术上讲,这里的洞见是,点火和全球工作空间是证据积累或同化的描述——这必然意味着一些时间叙事。这种叙述的性质变得直截了当
我们的模型提供的第一个主要见解是,许多先前的电生理学结果可以仅基于假设一个具有深层时间结构的简单 2 级模型来再现。然后,可以通过指定基于已知的意识神经关联似乎合理的模型的更高级别的整合功能,以及不同的隐藏状态因素(可能对应于涉及一般认知领域的关联皮层内的分布式处理中枢,即 van den Heuvel 等人,2012 年)如何对这些内容进行操作,来说明自我报告的意识感知与无意识感知。第二个主要的洞见来自于我们的模型如何说明了先验预期可以无缝地适应这个结构——提供了许多新颖的、可测试的预测。
最后,值得一提的是,虽然有人提出了旨在整合其他主要意识理论的建议,如整合信息理论(Oizumi,Albantakis & Tononi,2014 年)与 VFE 和主动推理(Safron,2020a,2020b),但这些建议在很大程度上仍停留在概念分析的层面,无法提供详细的模拟和由此产生的经验预测,而这正是 PGNW 架构的直接结果。
5. 结论和未来方向本文介绍了全局神经元工作空间的正式扩展——预测性全局神经元工作空间——在深度主动推理架构中实现。除了解释和统一视觉意识的神经相关文献中不同的发现之外,这里提出的预测性全球神经元工作区模型还产生了几个经验预测和机械神经计算解释,涉及 P3 和主观报告的关系、有意识通路下推理机制的神经生物学实现以及视觉意识中预期的作用。
软件注释:本文中详细描述的生成模型使用了一个通用的信念更新方案(spm_MDP_VB_X.m ),该方案是使用 freely 在 Matlab 代码中实现的
可用的 SPM 学术软件:https://www.fil.ion.ucl.ac.uk/spm/.用于生成这里报告的特定模拟的脚本可以从 https://github.com/CJWhyte/PGNW_ERP-1_2020.下载
参考:
智能生命的第一原理
生命主动推理的数学描述
回答薛定谔问题: 生命是什么?自由能公式
强化学习缺陷:如何用贝叶斯从错误中学习-安全及效率
新概率书 Structured Probabilistic Reasoning
用数学范畴定义生命的尝试
神经网络的一个底层结构缺陷
how we learn 第二章 人脑比机器强在哪?(长文)
自由能AI认知框架优点123456
直觉理解变分自由能的目标函数
自由能一书金句摘录及图表
短期记忆容量必需有限