路径积分,特殊种类,和奇怪的东西
关键词:自组织,变分推理,贝叶斯,马尔科夫毯,活性物质,路径积分
FEP是一个第一原理方法,可以应用于任何“事物”或“粒子”,以某种方式消除了物理学、生物学和心理学之间的界限。这种应用认可了许多关于感知行为和自组织的规范性解释。
后来扩展到描述生物和物理领域的几种事物从控制论到协同学,从强化学习到人工好奇心,从预测处理到通用计算,从模型预测控制到增权,使用统计物理学和信息论的标准结果来解析上面的叙述性论点
首先考虑活性粒子和惰性粒子的区别,它们分别有和没有活性态。然后我们考虑耗散粒子和保守粒子之间的区别,它们分别服从和不服从随机涨落。最后,我们转向普通粒子和奇异粒子之间的区别,它们的活动状态分别影响和不影响内部状态。
摘要
本文描述了自由能原理的路径积分公式。随后的叙述表达了一个粒子随时间演化所采取的路径或轨迹。主要结果是一种方法或最小作用原理,可用于模拟粒子与其外部环境进行开放交换的行为。粒子是由一种特殊的划分来定义的,在这种划分中,内部状态通过活动的和感觉的覆盖状态与外部状态区分开来。手边的变分原理可以让我们将某些粒子的内部动力学解释为推断隐藏在毯态背后的外部状态。我们考虑不同种类的粒子,以及它们在多大程度上可以被灌输一种推理或感知的基本形式。具体来说,我们考虑耗散粒子和保守粒子,惰性粒子和活性粒子之间的区别,最后,普通粒子和奇怪粒子。奇异粒子可以被描述为推断它们自己的行为,赋予它们明显的自主性或代理性。简而言之——在特定分区提供的粒子种类中——奇怪的种类可能更适合描述有知觉的行为。
介绍
自由能原理(FEP)描述了一个随机动力系统的动力学之间的简单关系,并描述了其参与推理的行为。FEP起源于神经科学,试图描述大脑的功能和行为(Friston et al. 2006 ),后来扩展到描述生物和物理领域的几种事物(Friston 2013Friston et al. 2021)通过一种特殊的力学——贝叶斯力学——与量子、统计和经典力学共享相同的基础(Friston 2019弗里斯顿等人2022)。本文是一系列技术论文的一部分,这些技术论文以越来越简单、越来越合格的术语描述了FEP(frist on,2013;弗里斯顿,2019;弗里斯顿等人,2022)。
路径积分公式
本文着重讨论FEP的路径积分公式。路径积分公式依赖于通过拉格朗日函数对随机动力系统的动力学进行编码(Graham,1977b塞弗特,2012)。拉格朗日函数扮演了自我信息或惊奇的角色,记录了通过状态空间的路径的不可思议性。换句话说,我们将处理路径或轨迹上的概率密度,而不是状态上的密度,后者涉及了许多关于FEP的近期文献(Ramstead等人,2022)。
从基于状态的公式到基于路径的公式的转变反映了FEP的教导性描述到其操作基础的转变,以路径上的概率密度来表示(Friston,2010;弗里斯顿,2012;Ramstead等人,2022年)。最近关于FEP的大部分工作都关注于用状态的概率密度来描述系统的动力学;即表达某些状态或事件发生的概率。在这里,我们将关注系统在状态空间中沿某一轨迹运动的概率。
路径积分公式提供的简化依赖于路径上密度的工作(与状态相反)。特别是,与FEP的基于状态的公式相反,我们对非平衡稳态的存在和功能形式不做任何假设(Friston等人,2022;弗里斯顿等人,2021)。
运动的广义坐标
从技术上讲,我们将在运动的广义坐标下工作(Balaji和Friston,2011;达科斯塔等人,2021aPavliotis,2014):我们用表示状态运动的n阶时间导数的额外自由度来扩充系统的传统状态空间。即位置、速度、加速度等。,被明确地表示为不同的(广义的)状态。这通过用一系列时间导数(即广义状态)代替状态(即路径)的时间序列简化了推导。在这种情况下,拉格朗日函数扮演一个动作的角色,其中最小动作的路径使广义状态的拉格朗日函数最小化。通常情况下,行动和拉格朗日被区别对待,因为拉格朗日是广义状态的函数,而行动是路径的函数,通常被定义为拉格朗日的路径积分(Seifert,2012)。这些观念在运动的广义坐标,因为路径相当于运动的广义坐标中的一个点(即广义状态)。
粒子和特定分区
FEP关注的是自我组织,它呼吁将“自我”从非我中个性化出来。我们考虑(广义)态的一种特殊划分,这种划分是把一个物体(即一个粒子)的内部态和外部态分开所必需的。这种划分是根据外部、感觉、活动和内部状态之间的稀疏耦合来定义的。然后,根据变分自由能引理来解开这种特定划分的含义,变分自由能引理说,最可能的自主(即,活动和内部)路径最小化关于外部路径的贝叶斯信念的自由能泛函。重要的是,具有保守动力学的粒子总是追求最小作用的路径,因此最小化变化的自由能。随后的最小作用原理或方法被认为是根据描述具有活动状态的活动粒子的贝叶斯力学。这类粒子的自主路径有一个拉格朗日量,称为期望自由能,可以分解为对应于期望成本和期望信息增益的项。在这种情况下,成本是感觉路径的拉格朗日或惊奇,它定义了粒子的特征轨迹。这意味着保守粒子符合贝叶斯决策理论的对偶最优性原则(Berger,2011;Wald,1947)和贝叶斯最优设计(Lindley,1956;麦凯,1992)。对感官惊奇的另一种解读是根据贝叶斯模型证据(也称为边际可能性),将自组织描述为自证(Hohwy,2016)。
特定种类
随后的公式自然导致粒子种类的类型学,或“特殊种类”。我们首先考虑活性粒子和惰性粒子的区别,它们分别有和没有活性态。然后我们考虑耗散粒子和保守粒子之间的区别,它们分别服从和不服从随机涨落。最后,我们转向普通粒子和奇异粒子之间的区别,它们的活动状态分别影响和不影响内部状态。这种区别意味着奇怪粒子持有的贝叶斯信念涵盖了它们的行为(的后果)。换句话说,奇异粒子的活动状态隐藏在内部状态之外,成为被推断出来的感觉状态的潜在原因。这导致了某种(奇怪的)粒子(看起来好像是)认为自己是保守粒子。因此,它通过信息和偏好寻求行为主动最小化预期自由能(巴尔托等人,2013;孙等,2011)。这种感知行为或主动推理可以表示为最小化广义自由能泛函,这可以被视为智能体设计或建模中的通用目标函数(Parr和Friston,2019)。这种行为推理(Ramstead et al .,2020)可以被解读为广义的计划推理(Attias,2003;伯特温尼克和图桑,2012;Lanillos等人,2021年)。
自由能原理
FEP是对自组织的简单描述,它与量子力学、统计力学和经典力学有着相同的基础,并导致了一种特殊的力学——贝叶斯力学——我们可以用它来描述某些“事物”在推理中的动力学(Fields等人,2021a弗里斯顿,2019;Ramstead等人,2022年)。FEP是通过仔细关注“事物”被定义的方式,从而关注它们与其他一切事物的分离和结合的方式而得出的。在制定FEP的路径积分公式之前,我们以叙述的形式总结一下步骤:
·FEP提出了以下问题:如果某物存在,在拥有特征状态或动力的意义上,它必须拥有什么性质?要回答这个问题,有必要定义一个事物或粒子。
·一个粒子由内部态和覆盖态组成。覆盖态构成了粒子内部和外部状态的边界。从数学上来说,这意味着在给定一揽子路径的情况下,内部路径有条件地独立于外部路径。
·这种条件独立性意味着,对于每个覆盖路径,都存在一个最可能的内部路径和外部路径上的(后验)概率密度。
·从最可能的内部路径到外部路径上的条件密度的随后的同步映射可以被解读为推理,在这个意义上,最可能的内部路径编码了关于外部路径的贝叶斯信念。
·通过将拉格朗日函数与变分自由能联系起来,这种贝叶斯解释可以变得显式;也就是说,一个关于外部状态的贝叶斯信念的自由能泛函,给定毯态。
·足够大(即保守)粒子的内部路径总是最可能的路径;即最少作用的路径,其中作用通常是拉格朗日函数(也称为自我信息或意外信息)的路径积分。
·保守粒子的活动路径(即,可能受内部路径影响的毯式路径)的拉格朗日量减少到变化的自由能。这意味着这种粒子的自治(即,活性和内部)状态似乎会遵循最小化变化自由能的最小作用路径。
·在这种情况下,自主路径的拉格朗日可以分解为感知路径的期望拉格朗日(即不可实现性或成本)减去期望信息增益;即减少外部路径的不确定性。
·这有一个有趣的解释,即自主路径似乎将最小化预期成本——其中成本被解读为表征问题粒子的感觉路径的拉格朗日函数——同时最大化预期信息增益。这是分别与贝叶斯决策理论的原则一致,例如,期望效用理论(冯诺依曼和摩根斯坦,1944年)和最优贝叶斯设计(林德利,1956年)。
·预期信息增益和预期成本的组合具有预期自由能的函数形式。
·最后,我们转向奇怪的粒子:保守粒子,它们的活动路径只通过感觉路径间接影响内部路径。奇怪的粒子可以被解读为推断它们自己的行为——除了外部世界——赋予它们明显的自主性或能动性。
总之,从事物的定义开始——用马尔可夫链来说——最后是(某些种类的)事物的贝叶斯力学。内部路径看起来好像是在推断外部路径——通过最小化变化的自由能。主动路径看起来似乎符合最优贝叶斯设计(Lindley,1956)和决策理论(Berger,2011)的原则——分别通过最大化预期信息增益和最小化预期成本。在这里描述的特殊种类中,奇怪的东西可能适合于描述代理的感知行为。
由此产生的FEP可以解读为最小作用量的变分原理,一种规范理论(Friston等人,2022;Sakthivadivel,2022cSengupta等人,2016),Jaynes最大熵或最大口径原理的对偶(Sakthivadivel,2022aSakthivadivel,2022b)或——在其量子理论公式中——渐近等价于幺正原理(Fields等人,2021a)。
从这个角度来看,FEP是一个第一原理方法,可以应用于任何“事物”或“粒子”,以某种方式消除了物理学、生物学和心理学之间的界限。这种应用认可了许多关于感知行为和自组织的规范性解释。从控制论到协同学(敖,2004;阿什比,1979年;哈肯,1983;凯尔索,2021);从强化学习到人工好奇心(巴尔托等人,2013;施密德胡伯,1991;萨顿和巴尔托,1981年;Tsividis等人,2021年);从预测处理到通用计算(Clark,2013bHohwy,2016;赫特,2006);从模型预测控制到empowerment(Hafner等人,2020;Klyubin等人,2005),等等。我们现在用统计物理学和信息论的标准结果来解开上面叙述的论点。