Nature Communications:社会训练通过重新配置我们的预测误差来形成对自我和他人边界的重新估计

2020-09-22 16:26:25 浏览数 (1)

区分自我与他人是人类社会生活中最重要的分类之一,在社会活动中如何区分出“自我”意识和“群体”或“他人”意识直接影响了我们如何与社会其他群体产生互动,个体如何在某种文化的生态下,建立自己的分类系统和解释系统是社会心理学界研究的研究热点。一般认为,人们更倾向于使自己的信念和价值观与社会群体相一致。但是,在陈述某种信念时却不接受这些信念的行为,对于预测他人行为和参与社会互动同样至关重要(比如你遇见不相信科学的人的时候,他虽然可以和你讨论关于科学的理论,但他实际上是不相信科学的,那你们之间就会产生关于彼此价值的认同问题)。因此,有必要在自我-他人的区分和自我-他人的融合之间取得一种平衡

有证据表明,人类可以通过在特定于主体的神经环路中模拟这一过程来实现对他人信念的评估,但目前还不知道该环路是如何形成的。本文训练被试进行社会学习任务,通过控制被试和其他被试看到相同信息的频率,来考察该被试如何考虑另一个被试的任务反应。训练至少在24小时内改变了预测误差(PE)回路的主体特异性,在独立任务中影响换位思考的神经环路。腹内侧前额叶髓鞘密度(磁化转移),与这种适应的强度相关。本文描述了一个额颞叶学习网络,它利用了不同主体计算之间的关系,表明自我-他人边界是可学习的变量,由社会经验的统计结构塑造。本研究发表在Nature Communications杂志。

前言

人类倾向于使他们的信念和价值观彼此一致,特别是在共同的社会群体中。然而,陈述信念而不采纳这些信念,对于预测他人的行为和参与流动的社会互动同样至关重要。因此,有必要在自我-他人的区分和自我-他人的融合之间取得一种平衡

一般认为,我们是通过对计算预测误差(PE)信号将内部预测与环境的实际经验进行比较得到的差距就是预测误差信号,可以理解为一个模型预测的值与实际观测值之间存在的差异)的修正来调整我们对世界的信念。除了对事物的预期以外,大脑还可以通过模拟另一个主体的预测信号来处理和他人的行为或精神之间的协调交流。在从事观察性学习、外显学习、社会性教学和亲社会学习的人的内侧前额叶皮质可以观察到模拟的奖励预测误差(RPE)。在奖赏学习领域之外,已经使用功能性磁共振成像(fMRI)和脑磁图(MEG)观察到了对另一个主体的感觉信号的模拟。

当同时记录被试自己和另一个主体的信念时,大脑使用不同的主体特定的神经环路来计算感觉PE,其分离程度预测了行为上的自我-他人区分。这意味着PE的神经表示,不仅包含关于环境中发生的事件信息,还包括建模该环境的主体身份信息的能力。如果自我-他人区分确实是通过在特定于主体的环路的表示计算来实现的,那么这些环路应该能适应社会情景的变化。

本文通过训练被试在两个社会情景下的心智任务来检验自我-他人区分是否容易受到依赖于经验的可塑性的影响。使用计算模型和fMRI显示,当自我和他人共享大量并发经验时,自我和他人属性PE之间的神经重叠持续增加,反之则持续减少。在不涉及学习的迁移任务中,这种训练也改变了大脑对自我-他人的区分。使用定量MRI发现腹内侧前额叶白质的髓鞘密度与这种自我-他人边界的再学习有关,腹内侧前额叶皮层(vmPFC)直接追踪与其他主体分享经验的可能性。最后结果表明,获得自我-他人边界的机制也适用于跨时间选择的非社会情景。

方法

被试

47名成人(26女),年龄19-54岁,实验为期3天。所有被试的视力正常或矫正到正常,没有精神或神经疾病的病史,都提供了书面知情同意,由伦敦大学学院研究伦理委员会根据第4446/003号伦理批准。六名被试只完成了第一天和第二天的实验。另有一名被试被排除在所有分析之外,因为在汇报情况时,他们显然不理解一些任务。最后有46名被试(25女),平均年龄为26.5岁(S.D.=7.8),以及由40名被试(22名女性)组成的小组,平均年龄为26.8岁(S.D.=8.1)。

错误信念任务

图1 实验设计

这个任务设计有点绕,如果看不懂可结合原文仔细阅读)这个任务中所有被试都要参与三天,在前两天都不进行fMRI扫描,只进行训练,在第三天开始进入fMRI扫描。在第一天,他们玩的是这个任务的简化版本,任务有两个,一个是视角的估计任务,就是图1a中最前面你能看到黑色的两个方块两边有不同的图案,被试需要根据特定的视角估计他在之前看到的图案以某个视角看的话,在现在的图片中有几个是那个视角的(看不懂的话后面还有这个任务的具体解释,可以看后面。这任务太绕。)还有一个任务与后两天的训练无关,是一个简单的预期判断任务,是选择当前的奖励价格还是一段时间后的奖励价格。这个任务就是考察一下被试的反应预期,与后面的fMRI实验无关,不用关注。

我们来看后两天的任务。后两天的任务同样有两个,一个是图1b中的任务,在这个任务中,有两个被试参与,分别在两个社会情景中扮演不同的角色。在第一个情景中,被试在一名“商店经理”(也就是另一名被试)的帮助下,扮演店员的角色,向热带岛屿上的游客出售粉色雨伞和黄色遮阳伞。使用一个波动的伯努利参数来代表销售粉色雨伞的概率,这个参数代表的实际含义是天气变化的概率,这个比较好理解,天气变为雨天的概率越高,销售粉色雨伞的概率越大,天气变为晴天的概率越高,销售黄色遮阳伞的概率越高。

第二个情景中,被试扮演一名店员,在“商店经理”的帮助下,根据商店外数字显示器上的广告,向城市里的游客销售红色和蓝色口味的可乐,波动的伯努利参数(卖出红色罐头的概率)代表饮料在当前受欢迎程度的变化。

在所有两个情景中,被试被告知,某些试验中,经理(就是图1b中那个橙色头发的人)将在密室里(就是图1b那个绿色的门没有打开),不能观察销售(“特权”),某些试验中,经理会走出密室,观察销售情况(“共享”条件,就是图1b中那个绿色的门是打开的),某些试验中,经理在后台观看闭路电视录像(就是图1b中那个圆圈),以跟踪销售情况,但却错误地观看了上周的录像,观察的是误导性信息(“诱饵”试验)。在这样三种情况下,就会产生三种状态:

第一种是店员被试知道转化概率并产生一个下一步会销售哪个东西的预测,但是另一个配合的经理被试不知道转化概率,并且店员知道经理不知道,因此不好预测经理怎么预测店员下一步销售哪个东西。

第二种是店员被试和经理被试都知道转化概率,同时店员知道经理也知道这个转化概率,所以可以较容易产生经理怎么预测店员的销售行为。

第三种是,店员知道真实的转化概率,但经理看到的是错误的转化概率,同时店员知道经理看到了错误的转化概率,这样店员会产生一个独立的根据真实转化概率的预期,也会对经理根据错误概率得到的预期产生一个猜测。两个预期是相互独立的。

为了控制三种不同情况的占比,作者设计了两个不同的占比实验。在“Hi-Share”情景中,有112个“特权”试验、112个“诱饵”试验和224个“共享”试验。“Lo-Share”情景中,有196个“特权”试验、196个“诱饵”试验和56个“共享”试验。被试不知道试验比例的差异。每个情景都与特定的替身配对。在测验任务中(也就是第二天的练习任务中),两种情境下的试验类型分布没有差异,均为148个。

被试可以观察到带有三个视角的显示器(图1A)。在底部,被试看到的是伯努利的预测结果(如粉色或黄色的雨伞,这个代表在当前的分布下,下一步卖出的哪个颜色的伞的概率。因为都是0 1分布,所以直接显示了预测的1是什么)。在中间,被试看到一张图像,表明试验是“特权”、“共享”还是“诱饵”。在顶部, 被试看到他们试图追踪的另一名主体的卡通头像(分别有男性头像和女性头像,为了排除另一个主体的性别带来的可能的影响)。显示时间为1500ms,然后是试验间隔,屏幕上有固定十字,时间为1000-1500ms。在4-9次抽样试验后,被试开始正式判断。被试必须沿着连续的刻度放置一个箭头,以代表自己估计的伯努利参数的估计值或者自己估计的另一个被试(也就是老板被试)估计的伯努利参数的估计值。他们没有收到任何关于表现的反馈,但被告知,在实验结束时的报销取决于他们在自我探针上对环境的跟踪能力,以及他们在他人探针上对其他主体选择的预测能力。图1c显示了店员被试(self)和老板被试(other)看到的每个trail的伯努利分布的概率。

用MatLab R_2018a对行为任务进行编码,并进行数据采集和分析。行为任务使用Cogent 2000(V125)和Cogent Graphics(v1.29)进行说明和可视化。除非另有说明,所有进行的统计测试都是双尾的。用Schapiro-Wilk检验确定测量的正态性。

学习模型

构建了72个Rescorla-Wagner学习模型当前决策学习里最常见的强化学习模型,不懂的点https://zhuanlan.zhihu.com/p/24437724这里)。模型测试了各种参数组合。他们都对自己和他人使用了并行的信念更新。自我属性的PE在“诱饵”试验中被模拟为0。他人属性的PE在“特权”试验中被建模为0。

参数包括学习速率(α)、选择频率(τ)、记忆衰退(δ)和自我对他人信念的错误估计率(λ)。这些参数可以在自我和他人更新之间共享,或者独立。λ参数的操作方式类似于学习率,但会使用错误主体的PE进行更新。PEs被计算为伯努利分布的结果(1或0)与先前关于伯努利参数的信念(自我或他人)之间的差值。信念介于0和1之间。当记忆衰减和λ参数尽可能接近0时,FBT中的行为是最佳的。在MATLAB中使用fmincon函数通过非线性优化对模型进行极大似然估计拟合。

这些模型适用于四个不同的数据集:训练的Lo-Share和Hi-Share情景(第2天)和测试中的Lo-Share和Hi-Share情景(第3天)。通过比较每个模型被试的贝叶斯信息标准(BIC,与AIC值的作用相当,用来筛选最优模型)之和,进行模型比较。对于测试阶段(第3天)的fMRI分析,每个被试使用相同的模型和参数来估计PE。

对于每个模拟数据集,计算了四个模型中每个模型都是最佳拟合的被试的比例。给出了p(fit|sim),假设另一个(或相同的)模型模拟了数据,则该模型是最佳拟合的概率。使用贝叶斯规则将P(fit|sim)转换为P(sim|fit),如下所示,假设模型的优先顺序是一致的。

换位思考范式(也就是我们在前面说的视角转换实验)

图3 a 视角转换任务说明

如图3a所示,在每一次试验中,都会显示一个目标图形和该图形的目标数量。然后,一个房间被展示出来,房间里有一个头像面对着墙。在每一次试验中,图中的卡通小人可见的一面墙上有两个图案,不可见的第二面墙上还有两个图案。一些图案与目标图案匹配,还有一些是干扰图案,看起来像目标图案,但顺时针旋转了60度。目标图案的方向在每次试验中随机改变。被试在整个任务中会看到三个不同的卡通小人头像。其中两个是代表来自FBT的Lo-Share和Hi-Share情景的替身。第三个是一个箭头。

每个试验以500-1000ms的注视十字开始,然后是被试被要求采用的视角,500ms (视角包括“你”、“他”、“她”或“箭头”,分布代表被试自己,以及另外三个图里会出现的不同视角的卡通小人)。当提示说“他”或“她”时,被试必须分别采用男性或女性卡通小人的视角来报道。当提示“箭头”时,被试只需报告箭头指向的目标图案的数量与目标数量是否一致。然后,显示目标图案和目标数量750ms。该任务由384个随机顺序呈现的试验组成。视角(自我或他人)、条件(一致或不一致)、反应(是或否)、屏幕上的替身(Lo-Share、Hi-Share或箭头)和替身凝视(左或右)在2×2×2×3×2设计中得到平衡。

漂移扩散模型

采用FAST-DM-30.2工具箱,采用最大似然估计法对视觉透视提取任务进行了漂移扩散模型拟合(该模型的目的是分离任务(例如不固定响应时间的random dots)准确率(accuracy)和响应时间(response time)间的交互关系。该模型将速度和准确性与快速(少于1-2秒)的二选一决策相关联,它解释了为什么有时反应速度和准确性相关,而有时却不相关(尤其是在个体之间

为了允许模型为正确和不正确的反应生成不同的响应时间分布,考虑了试验间漂移率的可变性。这些分布考虑了不同的试验类型,即三个替身(Hi-Share、Lo-Share、Arrow)、两个视角(SELF、OTHER)和两个条件(一致、不一致)。这12个分布有不同的均值参数,但共用一个特定于被试的方差参数。对于“是”和“否”的回答,所有12个平均漂移率参数都是相同的。其他参数包括非决定时间(均值和方差)、漂移起点(均值和方差)和边界分离距离(均值和方差)。这三个参数在每个试验中从高斯分布中随机抽样,均值和方差符合每个被试的数据集。与漂移率不同,这三个参数的分布不随试验类型而变化。

箭头试验用于获得与FBT无关的重复训练效果的衡量标准。通过从Hi-Share和Lo-Share试验的表现变化中减去箭头试验的表现变化,可以量化训练效果。对于每个被试,对于12个漂移率参数,从转移(第二天)的估计参数中减去基线(第一天)的估计参数,以获得变化分数。然后,通过减去箭头试验的变化分数来修正变化分数。用Schapiro-Wilk检验确定参数估计的正态性。

MRI数据采集

使用3T全身MRI扫描仪(西门子,Magnetom Prisma系统)。40层,3mm各向同性,TR为2.8s,TE为30ms,层倾角为-30°,Z-shim为-0.4。使用Nonin 8600FO脉搏血氧仪监测心率,在扫描过程中使用西门子呼吸带监测呼吸频率。在功能扫描之后,测量B0场的不均匀性。

进行了三次3D多回波FLASH采集,分别以T1、质子密度(PD)和磁化转移(MT)加权为主。PD加权和MT 加权图像的翻转角为6°,T1加权图像的翻转角为21°。通过施加持续时间为4ms、标称翻转角为220°、频率为2 kHz的高斯射频脉冲来实现MT加权。数据采集全脑覆盖,各向同性分辨率为0.8 mm。采用交替读出梯度极性来获得梯度回波,以2.3ms的步长在2.3~18.4ms的8个等距回波时间下采集。只采集了6个用于MT加权采集的回波,以维持所有volume的TR为25ms。

在每次FLASH采集之前,采集两个额外的低分辨率volume(8 mm各向同性),一个具有64通道头颈阵列线圈,另一个具有体线圈。在每种情况下,使用6°翻转角和6ms的TR采集具有2.2ms TE的单个回波。每个校准volume的采集时间为5.9秒,用于校正接收灵敏度场的位置特异性调制。

功能磁共振成像预处理

SPM12工具箱中进行时间校正,运动校正、配准。使用场图对运动校正后的图像进行校正。功能图像被配准到各自的T1图中,归一化到MNI空间,然后用半高全宽(FWHM)8 mm各向同性的高斯核进行平滑。使用PhysIO Toolbox v7.2将生理数据转换为18个噪音回归变量。

PE定位

两个一般线性模型(GLM),一个用于定位PEself,另一个用于定位PEother。Self-GLM模拟了特权”和“共享”试验,由PEself进行参数调整。Other-GLM模拟了“共享”和“诱饵”试验,由PEother参数调制。使用无符号PE信号,因为对信号中与刺激结果(颜色)相对应的分量不感兴趣,而是对信号中的分量感兴趣。时间导数和离差导数也包括在内。在全脑分析中,使用p<0.001的阈值,使用高斯随机场理论控制FWE比率,在组水平上识别出显著的团块(cluster)(p<0.05 FWE校正)。

然后,使用The Decoding Toolbox (版本3.994)进行探照灯(search-light)多体素分析。通过将每个试验的不同GLM拟合到归一化但未平滑的图像中,获得了试验特有的激活模式。生成了一个beta地图,代表了对整个感兴趣的试验的贡献,然后进行解码分析。运行了两个全脑探照灯程序,一个用于PEself,另一个用于PEother。对于每个分析,在三个功能数据上训练最小绝对收缩和选择算子(LASSO)线性回归模型

然后对回归模型进行测试。表现被量化为模型的预测PE值和实际PE值之间的Fisher Z变换相关性。对四个测试集中的每一个的变换相关系数进行平均以产生平均交叉验证解码准确率。用L1惩罚参数范围(10-5到10-3,增量为2.5×10-5)对每个被试重复这一过程。然后用半高宽8 mm各向同性的高斯核对全脑准确率图进行平滑。

自我-他人边界的分类分析

第一步是使用主成分分析(PCA)提取特征,第二步训练关于这些成分的LASSO Logistic回归模型,以将试验分类为PEself或PEother。

使用嵌套交叉验证来优化两个超参数,L1惩罚和由主成分解释的百分比方差。使用网格搜索,随机抽样。对于每一对可能的超参数值,通过从训练集中随机抽样每个类别的两个试验,执行了40次内折交叉验证。选择产生最低交叉熵的超参数。

最后,将优化后的超参数分类器应用于测试集,并测量交叉熵。整个过程重复进行40个外部折叠的交叉验证,性能被量化为其中位数。此分析进行了两次,一次是针对Hi-Share情景,另一次是针对Lo-Share情景。

交叉解码分析

该分析用PEself幅值的标签训练线性回归模型,并测试以预测PEother幅值,反之亦然。由于训练和测试集的自然分离,执行8个外折和1个内折交叉验证。为了调整超参数,预测的PE幅度和真实的PE标签之间的Fisher Z变换相关性被最大化。此分析进行了两次,一次是针对Hi-Share情景,另一次是针对Lo-Share情景。

MT(磁化转移)分析

创建定量MT图,然后使用SPM12中的hMRI工具箱对其进行空间处理。包括:分割、微分变形和组织加权平滑。每幅图转换成灰质(GM)、白质(WM)和脑脊液(CSF)组织图像。在将图像归一化到MNI空间之前,将所有被试的组织图像迭代地对齐到自己的平均值。最后,用半高宽为6 mm的各向同性高斯核进行组织加权平滑。

在群体水平进行了全脑、单变量回归。功能磁共振交叉解码效应是自变量,白质MT是因变量,年龄、性别和颅内体积为协变量。使用p<0.001识别团块(cluster),并使用GFRT控制错误率。

为了检测效应量(相关性)为0.64时,第一类错误率为α=0.001(团块(cluster)的阈值),第二类错误率为β=0.1(90%功率),我们需要39个被试的样本大小。样本量是40名被试,有足够的能力来检测与之前在主体间MT变异性研究中看到的类似大小的影响。

共享试验跟踪分析

构建了一个Rescorla-Wagner模型来跟踪观察“共享”试验的可能性:、

其中,Pt是在试验t上观察到“共享”试验的概率,η是学习率参数,S表示试验是否是共享的,在“共享”试验上编码为1,在“特权”和“诱骗”试验上编码为0。假设被试在第二天已经了解到,观察到“共享”试验的概率在Lo-Share条件下为12.5%,在Hi-Share条件下为50%,并在第三天的fMRI期间提供了对这两种情况的起始估计。

对每个被试构建GLM解释BOLD信号的可变性,使用P回归变量及其时间和离差导数。使用不同的η值重复分析五次。首先进行感兴趣区(ROI)分析,使用双侧vmPFC的mask。然后进行全脑分析。使用p<0.001的聚类形成阈值,使用GFRT来控制体素间多次比较的FWE比率,应用Bonferroni校正来控制多重比较错误。

跨时间选择任务

在第一天,让被试在立即的小额奖励和延迟的更大奖励之间做出选择。直接的奖励是从1到9英镑的礼物,这些礼物将在实验结束时发给被试。延迟奖励是指从2到10英镑的礼物,这些礼物将在一段时间的延迟后发给被试,包括:一天、一周、两周、四周、六周、八周和十二周。被试需做出与他们的主观偏好一致的选择。

延迟折扣模型。对被试的跨时间选择行为拟合了两个折扣模型。第一个模型是双曲线折扣模型:

Vlater值表示后一个选项通过折扣函数后的值。V表示原始的,未折扣的选项值。d表示奖励的延迟(以天为单位),k是自由参数。第二个模型是一个双参数双曲线折扣模型,其中D由一个附加的折扣参数S指数化,表示史蒂文斯的幂律时间感知:

两个选项值之间的差异通过softmax函数传递,以解释概率选择行为。

Plater表示被试在特定试验中选择“较大后者”选项的概率。β是自由参数。

模型在对数空间中用不受约束的参数值进行拟合。优化了观测数据的最大后验概率(MAP)。通过最大化来自所有被试的所有数据的可能性来估计该高斯先验的超参数(均值和方差)。为了优化先验分布的超参数,使用了期望最大化(E-M)算法。

在每个E步,通过使用MATLAB中的fminunc函数最小化负的对数后验概率,为每个被试计算MAP估计。此MAP参数的方差是使用拉普拉斯近似计算的,该近似假定后验分布只是MAP估计周围的高斯分布。

然后使用这些特定于对象的均值和方差来更新M-步骤上的先验的超参数。

先验分布的方差包括每个对象j的后验的主体方差(σ2),以及每个对象的均值(M)与先验均值(μ)的偏差。n表示被试的总数。为了比较每个模型的拟合优度,我们计算了每个模型的iBIC。

由于双参数模型中的两个参数都对折扣做出贡献,将综合折扣度量定义为log(KS)。通过log(KS)的中位数分割,使用学习模型的参数拟合FBT数据,进行了基于被试的留一logistic回归分析,以检验我们是否能够预测一个被试是高折扣还是低折扣。进行置换检验获得统计显著性。

结果

实验

被试玩了两个不同的游戏,每个游戏都有不同的玩家参与。在“Hi-Share”训练时,50%的试验是“共享”的。“Lo-Share”时,12.5%的试验是“共享”的。24小时后,在扫描fMRI的同时,被试再次与两名玩家进行游戏,此时有三分之一的“共享”试验。研究者预测被试不仅模拟其他玩家的PEs,而且训练中经验分享的程度也将决定自我和他人属性的PEs在神经上分离的程度。因此预测,在Lo-Share情境中,自我-他人差异将比在Hi-Share情境中更大

自我-他人区分的行为适应性

通过将被试对伯努利参数p的预测与用于产生观察结果的真实p相关联来量化行为表现(图2A)。本研究感兴趣的是行为差异是否会持续到测试阶段。在测试过程中,被试在Hi-Share情景中的表现明显较差。还观察到了情景(Hi-或Lo-Share)和试验(自身或他人)的交互作用。Hi-Share情景中,被试的任务表现在估计自我预测概率的试验中受到损害,但在预测他人的预测概率的试验中没有受到影响。

将学习模型与被试的选择行为拟合,以评估打乱的自我-他人区分是否为Hi-Share情景下的表现受损提供了解释。按如下方式实现自我的信念(B)更新:

被试对伯努利参数的信念Bt 1是由他们对先前试验Bt的信念加上预测误差PEself给出的,该预测误差是基于在试验期间看到的由学习率α加权的自我相关信息。第三项s是记忆衰退,即信念随着δ比率向偶然性水平漂移。最后一项是无法将自我和他人的学习完全分开,这样自我的信念更新对他人的预测误差PEother很敏感,由参数λ控制。同时执行了一个并行的信念更新来模拟对方的学习。用不同的参数测试了上述形式的变体模型,分别用于“自我”和“他人”,或“共享”和“特权”/“诱饵”试验。所有模型都有至少一个学习率(α)和选择频率(τ)。有些模型包含1个或2个记忆衰减参数(δ),有些模型包含1个或2个Self-Otherλ参数。

无论是在训练还是测试中,Hi-Share情景中的行为都可以通过包含λ的学习模型得到最好的解释,而Lo-Share可以通过没有λ的模型得到最好的解释。因此,自我属性的PE也用于更新他人属性的信念,以此来合并自己和他人的信念轨迹,反之亦然。能最好地解释Hi-Share任务行为的模型包含单个λ参数,及不同试验类型的多个学习率(α)。且α在代表他人时更大,因此λ对自我更新的贡献比他人更大。在Hi-Share任务中,自我和他人的λ:α比率在测试中的差异,与自我和他人探针试验之间的表现差异呈负相关,因此可以部分解释图2A所示的相互作用。图2b显示了由λ引起的自我-他人合并效应。在两次训练中都观察到情境对自我-他人相关的主效应。Hi-Share的自我-他人相关性高于Lo-Share。通过使用不同的λ模拟信念轨迹,观察到λ是自我-他人合并效应的强烈决定因素,也就是说越是无法把自我学习经验和他人学习经验区分开,就越容易在自我判断的任务中表现更差,但在对他人预测结果的判断中表现更好

图2 行为训练导致自我-他人区分能力的持续变化

行为训练传输到换位思考任务

接下来考察了这种对自我-他人区分的训练效应是否推广到了不同的认知领域。被试在FBT训练之前和之后进行改编版的视觉透视任务(图3A)。被试以自我视角或受限视角处理视觉情景。向被试呈现目标模式和数字。最后,向被试展示一个只能看到一半的视觉情景。该情景包含四种图案,其中一些与目标图案相同,另一些是干扰。被试判断是否看到了目标模式的目标数量,是否采用了相关的视角,自我还是他人。

用漂移扩散模型中的漂移速率参数对行为进行了量化,其中漂移速率越高,表示响应越快、越准确。结果发现,在基线和转移两个指标下,一致试验上的漂移率都高于不一致试验(图3B)。在使用Lo-Share替身的试验中表现改善,在Hi-Share替身的试验中表现恶化(图3C),分别与增加和减少的自我-他人区分一致。

图3 行为训练传输到换位思考任务

自我-他人区分的神经适应性

首先在大脑中定位PE信号。使用单变量和探照灯多体素模式分析,在纹外、顶叶和补充运动皮质中发现了自我和他人属性的感觉PE(图4A)。将mask定义为这些群集的并集,训练关于自我和其他属性PE的活动模式的分类器并测试。自我-他人分类在Lo-Share情景中显著高于随机,但在Hi-Share情景中不是,分类准确率有显著差异 (图4b)。

为了排除Hi-Share中的空结果没有反映重叠的活动模式,而是反映了更嘈杂的数据,测试了分类分析的逻辑逆,并比较了自我和他人属性PEs表征的相似性。如图4C所示,说明Hi-Share情境促进了PE信号的自我-他人融合,Lo-Share情境促进了自我-他人区分。在Hi-Share情境中,交叉解码准确率的情景差异与平均λ:α比率相关。因此,在PESELF和PEother之间表现出最大神经重叠的被试,也是那些表现出将自我和他人属性学习混为一谈的被试。

vmPFC髓鞘密度与PE适应有关

结果表明,被试学习了自我和他人属性计算之间的关系。为了探索哪些大脑区域对于获取或运用这种相关知识是重要的,获得了磁化转移(MT)的定量MRI图,即髓鞘密度。

进行了全脑分析,年龄、性别和颅内体积为协变量。结果发现了右侧vmPFC附近的白质团块(cluster)(图4E),该区域髓鞘密度较高的被试可能对学习自我-他人关系或以情景相关的方式运用这种关系知识更加敏感。

图4 PEs的表现与行为训练相适应

vmPFC追踪共享信息的可能性

vmPFC在塑造自我-他人区分方面起到什么作用内容呢?

图5 在vmPFC和颞叶追踪自我共享信息的概率

作者构造了一个新的基于模型的回归变量来描述被试在“共享”试验的感知概率(图5A) 。该模型使用了单个参数η作为学习速率,它控制被试了解观察到“共享”试验的概率的速度。构建了双侧vmPFC的mask,并测试其血氧水平依赖(BOLD)信号是否与新回归变量相关(图5B)。用η的五个任意值(范围从0.01到0.1)重复分析,使用Bonferroni校正。当η=0.01时,在双侧vmPFC中发现一个显著的团块(cluster)。全脑分析发现当η=0.025时,左侧颞叶皮质有一个显著的团块(cluster),延伸到左侧颞极(图5B)。vmPFC似乎可以跟踪低频波动,而外侧颞叶皮层可以跟踪高频波动。在vmPFC中表现出强烈追踪低频漂移的被试与在颞叶表现出强烈追踪高频漂移的被试是相同的。

vmPFC团块(cluster)中的平均对比度估计与适应效果呈正相关(图5C),再次量化为Hi-Share和Lo-Share条件下自我-他人交叉解码的差异。然而,颞叶中的平均对比度估计与适应效果之间没有相关性。这与vmPFC和外侧颞叶皮层追踪不同频率的漂移是一致的。只有自我-他人关系被缓慢地重新学习时,神经适应效应才在测试过程中被检测到。相反,快速的关系学习会快速消除之前在两个情景之间学到的任何差异。

自我-他人边界的通用计算

自我-他人区分的神经计算是否与社会环境唯一相关?情节思维或“心理时间旅行”也是一种认知过程,涉及到将心理状态归因于不同的主体。研究者预期,强烈区分自我-他人的被试会更好地区分现在的自我和未来的自我,因此会更大幅度地对未来的回报打折扣。

为了验证这一预测,被试玩了一项跨时间选择任务,在即刻的小额奖励和延迟的大额奖励之间做出选择(也就是我们在方法部分解释的对于现在奖励和未来奖励选择的任务)。选择行为用一个双参数双曲线折扣模型描述(图6A)。与预期一致,因子λ:α与两个折扣参数的对数乘积呈负相关。表现出更多自我-他人融合的被试对未来奖励的折扣程度较低。

图6 颞叶折扣倾向可以用自我-他人区分来预测

为了进一步探讨这种关系,使用FBT中的学习模型的每个参数,使用留一交叉验证,将被试分类为高折扣者或低折扣者。只有λ参数预测折扣高于随机水平。当将自我-他人合并的功能磁共振测量作为额外的训练特征包括在内时,分类准确率显著提高。最后,在MT(磁化转移)与fMRI训练效果共同变化的同一大脑区域,发现MT与被试之间的折扣率呈负相关。

总结

自我和他人是否有一致的信念和价值观在社交中具有重要意义,与此同时,区分自我和他人的不同也是至关重要的。本文进行了几个非常有趣的游戏,并在游戏过程中采集大脑的神经响应,使用一系列行为学建模,结合任务态和结构像数据,发现了特定于不同主体的神经环路,腹内侧前额叶髓鞘密度与其息息相关,且发现了一个额颞叶学习网络。本文结果支持一种计算机制,该机制使一个模型的更新能够影响另一个模型的改变。此外,对一个主体模型的更新的泛化程度是可学习的,说明我们可以以灵活的情景相关的方式,跨时间空间来处理这一过程。

原文:

Social training reconfigures prediction errors to shape Self-Other boundaries

0 人点赞