请点击上面“思影科技”四个字,选择关注我们,思影科技专注于脑影像数据处理,涵盖(fMRI,结构像,DTI,ASL,EEG/ERP,FNIRS,眼动)等,希望专业的内容可以给关注者带来帮助,欢迎留言讨论,也欢迎参加思影科技的其他课程。(文末点击浏览)
研究亮点
在认知心理学、神经科学和应用教育研究中,人们如何估计数字量的问题至关重要。一般认为,对数字的估计是快速的,并且在视觉场景中并行发生。在这里,作者展示了人们对数字的估计是由一系列的注视决定的,他们的平均估计和他们的精度都随着他们的中央凹点数的增加而增加。这一机制表明,相当一部分将估计视为纯数值测量的研究可能会遗漏一个重要部分:数值估计能力与控制眼球运动和注意力的机制密切相关。
文献导读
近似数系统(ANS)由于其在早期数学发展中的潜在重要性以及它在物种间的保守这一事实而引起了广泛的兴趣。ANS模型和ANS敏锐度的行为测量都假设数量估计是快速计算的,并且在整个视觉场景中并行计算。但是,本次提出的证据表明,ANS的估计在很大程度上是一系列累加机制作用于注视的产物。作者使用眼动仪收集被试在进行数量估计和辨别任务时的注视数据。结果发现,我们能够使用他们的注视数据来预测被试的数字估计:即随着注视点数的增加,平均估计数也会增加,估计误差也会减小。一个详细的基于模型的分析表明,注视点对估计数量的贡献是外围点的两倍;人们不会“重复计算”复杂的注视点;他们也不会根据场景中固定区域的比例进行调整。作者提出的累积机制解释了显示时间对估计的影响,以及对低估数量偏差的早期发现。
引言
从婴儿期开始,人类就配备了一个近似数系统(ANS),允许不精确的数量估计和比较。个体的ANS的敏锐度通常是根据其韦伯分数w来量化的,w是一个实数,反映了噪声是如何以数字尺度进行表征的。具体地说,ANS的一个流行的心理物理模型假设一个数n由一个平均数n和SD w*n的高斯函数表示,因此一个较低的w意味着一个真实度较高的系统。
然而,一些研究混淆了ANS的简单图像。一些研究表明,个体的韦伯分数高度依赖于任务。事实上,韦伯分数的重测信度很低,即使使用相同的任务进行测量。数量估计也受到刺激的非数值特征的影响,例如场景中的聚类程度。最后,数量估计的精度会随着刺激持续时间的延长而提高,这表明ANS估计可能涉及某种时间过程。
尽管如此,先前的ANS计算模型已经在其体系结构中构建了速度和并行性。例如,许多主要的ANS模型是正反馈神经网络模型,其中输入是并行和瞬时处理的。本研究的目的是批判性地评估ANS是否应该作为一个快速且完全平行的简单过程去描述。
作者的目标是通过行为实验和模型驱动分析数值估计中可能涉及的时序机制。他们提出了一个模型和两个实验的行为数据,挑战了标准的平行感知理论。该研究的结果为ANS评估提供了新的支持,该评估涉及跨视觉注视的顺序整合。
作者分别进行了估计(实验1)和辨别(实验2)任务,在这些任务中,被试在不同的呈现时间中对数量进行判断。作者使用眼动仪收集注视数据,以便可以测量被试的ANS估计是如何受到注视路径的影响的。研究表明,ANS估计值是一个连续累积过程的结果,即估计值随着中央凹点的增加而增大。个体的ANS敏锐度差异可能反映了认知过程的差异,而这些差异(注意力或视觉处理速度)与数字估计没有直接关系。
材料和方法
实验1
电脑屏幕为24英寸,长宽比为16:10,屏幕分辨率为1920×1200像素。每个被试都对屏幕进行垂直调整,以确保屏幕的中心与他们的眼睛水平对齐。被试距离屏幕26英寸。屏幕从左到右和从上到下分别与被试视野的38°和26°相交。眼动仪型号为:Tobii T60XL,采样率60读数/秒。使用Tobii的内置软件对被试的眼睛进行校准。
呈现的每个点的半径为10像素。图像中的点密度范围为0.01到0.07点/deg2。值得注意的是,点的大小恒定意味着不可能直接测试ANS估计是使用数字还是密度。每个trial显示的点数在10到90个点之间(包括10到90个点)。实验共有在4个时间条件,在每个条件下,被试都会看到16个(随机选取)且在不同条件间相同的数字,数字随机呈现。被试使用电脑上的键盘输入他们的数字估计值。
被试
共有27名来自罗切斯特大学社区的成年被试,其中女性:15名,男性:12名。被试的年龄范围为18-29岁。
程序
实验共64个试次,4个block,每个block16个trial。4个block分别为四种时间条件:100;333;1000;和3000 ms。block的顺序在被试间随机分配。在每个trial中,都会显示点,然后是噪声mask。然后,被试用键盘在文本框中输入他们答案,然后按回车键进入下一个trail。
在这项任务中,我们对被试进行了眼睛跟踪,以确定他们的估计是如何受到他们注视路径上的点数影响的。重要的是,屏幕覆盖了一系列被试的视野(即根据被试的首次注视点的范围先设定了点的位置),这确保了一些圆点可以从最初的注视点上看到,而其他圆点可以从周边看到。
图1 评估任务的阶段,按顺序排列
实验2
实验2是数字辨别任务。实验2中使用的刺激材料的性质同实验1(例如,两者中的点具有相同的半径)。随机选择十六对数字呈现给每个被试,数字对的比率(最大值的最小值)范围:0.5~0.99。每个被试,在4个时间条件下使用相同的数对,随机呈现。
程序
被试同实验1。实验开始前,给每个被试重新校准。在这项任务中,被试会看到两个点,一个接一个,然后问他们认为哪种刺激有更多的点(按键盘上的1或2)。实验包含4个条件,每个条件有16个trial(如实验1),每个条件中两个点的呈现时间分别为(100;100 ms),(100;1000 ms),(1000;100 ms)和(1000;1000 ms)。
我们预测,如果在这项任务中,ANS的估计也依赖于中央凹的积累,那么被试会偏向于选择呈现显示时间更长的点。
结果
基本数字在心理物理学上的重复发现
图2A显示了平均估计值(y轴)如何随显示的数量(x轴)变化。该图有两个方面值得强调:首先,均值估计值随数量的函数近似线性变化,这与韦伯的数制模型完全一致。第二,这显示出低估较大数字的强烈趋势。图2B示出实验1复制了ANS估计的第二个传统特性:尺度可变性,其中估计误差在幅度上线性增加。
图2 A为估计值作为呈现的点数量的函数。
(B)被试估计值的标准差,作为呈现点数的函数。
(C)估计任务中各时间条件下的被试水平(黑色)和组水平(蓝色)斜率。
(D)评估任务中每个时间条件下的被试(黑色)和组水平(红色)韦伯分数。
C和D分别为从该模型中提取的各时间条件下的平均斜率(图2C)和韦伯分数(图2D)。组水平平均值用蓝色表示,被试水平用黑色表示。如果被试的估计是无偏的,那么组水平的平均斜率将是1(黑色虚线),如果时间没有影响,组水平的平均斜率和韦伯分数(y轴)将在时间上保持不变(x轴)。相比之下,从图2C中可以看出,当斜率小于1时,被试总是低估,但这种低估效应随着时间的增加而减小。从最短到最长的时间条件下,被试的平均斜率增加约17%。这是数量随时间累积的期望:报告的数量随时间增加而增加。此外,他们的平均韦伯分数降低了约21% (表S1)。从图2D可以看出,韦伯分数随着时间的增加而减少。
更长的时间可以提高估计的均值和方差
为了评估时间是否影响了被试的回答,作者进行了层次回归,以评估时间对平均估计和韦伯分数的影响,包括被试和组层面的回归效果。该模型假设均值和SDs随数量增加呈线性变化,符合韦伯定律。更具体地说,在显示n个点的trial中,每个被试的平均估计值来自以β·n为中心的高斯分布,并用SD w·β·n建模,其中β和w是层次拟合参数(补充材料SI)。
表S1 各条件组水平的回归权重及其95%可信区间
估计的关键是中央凹
如果ANS估计是由跨眼跳的数量累积驱动的,那么平均估计应该随着中央凹的增加而增加。且当考虑中央凹时,时间没有影响,也就是说,时间只是允许更多的眼跳。为了评估这一点,作者总结了在一次试验中,在被试注视路径中心5°范围内(通常称为“中央凹旁区域”)超过50 ms的点的数量。将在这段时间内看见的点视为“中央凹”。图3提供了四个 trials示例,描绘了在显示刺激时被试在屏幕上的注视路径。填充点表示“中央凹”点。
图3 一个被试在3s时间条件下的注视路径,每个图代表一个trial。所有点表示屏幕上显示的点,填充的点表示为中央凹的点。标签N/F/EN分别表示:显示了多少点(N),中央凹点数(F),以及被试实际估计的数量(E)。
图4A显示了每个时间条件下的中央凹点的百分比。正如所料,时间越长,中央凹点越多。从最短时间到最长时间,中央凹点的平均比例增加了三倍以上(18-64%)。与时间效应是由中央凹点的累积引起的假设一致,当联合考虑中央凹点的效应比例时,时间对估计的影响消失。图4B显示了估计值与真实数量之间的百分比偏差。这些线的重叠表明,当同时考虑到中心凹和时间时,不存在时间的影响。
图4 (A)在组水平(红色)和每个被试(黑色)上,中央凹点的比例(y轴)作为时间(x轴)的函数。
(B)估计数与点的真实数目(y轴)之间的百分比偏差,作为中央凹点百分比(x轴)的函数。颜色表示不同的时间条件。
(C)被试平均估计数的斜率(y轴)作为中央凹点百分比(x轴)的函数。
(D)韦伯分数(y轴)作为中央凹点百分比的函数
为了正式评估这一点,作者进行了第二次层次回归,与上面报告的相同,只是它包含了一个协变量,即中央凹点的比例对每个被试估计的均值和方差的影响。此回归显示中央凹点的比例显著影响被试估计值的平均值(图4C)和韦伯比率(图4D),并且当考虑中央凹点时,时间的影响消失。此外,当100%的圆点都在中央凹时,被试的估计几乎没有偏差(图4C中的斜率≈1),这表明先前观察到的低估偏差不是误判,而是由于被试没有将所有圆点都放入中央凹。在一项单独的分析中,作者发现在每个时间条件下观测到的中央凹对平均估计数的影响是单独存在的(补充材料表S3)。
表S3各时间条件下中央凹对斜率影响的组水平回归权重及其95%置信区间
因此,这些结果为1)ANS的低估计问题和2)时间效应的研究发现提供了另一种解释。事实上,两者都存在于中央凹点连续累积驱动数字估计的机制中。这一发现对韦伯比率作为数字认知测量的结构有效性提出了质疑,因为数字估计取决于有多少点恰好是在中央凹的,这是一种非数值的能力。
实验2
图5A显示了被试在第二次显示中的响应点数多于第一次的比例,作为第二次显示相对于第一次显示的点数比率的函数。回答第二次显示更多的被试的比例是随着两者的比例增加而增加的。图5B显示出了准确性作为绝对比率(Min/Max)的函数。被试能够分辨出5:6的比率,准确率约为75%。
图5. (A) 被试回答第二次显示有更多点的概率,作为比率N1/N2的函数,其中N1和N2分别是第一次和第二次显示中的点的数量。拟合曲线(以及此显示中的所有其他拟合)来自probit回归。
(B) 准确度作为绝对比率(Min(N1,N2)=Max(N1,N2)的函数。
(C) 被试回答,在长-短(蓝色)和短-长(绿色)条件下,第二次显示更多的点,作为比率的函数。
(D)在长长(黄色)和短短(红色)的情况下,准确度作为绝对比率的函数。
图5C显示了临界条件下的响应曲线,其中,第一次和第二次显示的时间不同,但是总的显示时间是受控的(长-短和短-长)。正如预测的那样,这些曲线之间的差异表明,被试选择第二个显示时,在显示时间长和显示时间短的不同情况下是有偏差的。图5D表明了两次显示相同时间但总体呈现时间不同(短-短-长-长)的条件下的响应曲线。图5D中观测到的响应曲线的差异表明,长-长条件下的响应比短-短条件下的响应更准确。被试选择第二次的比例在短-长条件下为62%,在长-短条件下为45%,正如预测的那样。在短-短(56%)和长-长(57%)两种情况下,被试均以中等比率选择了第二次。
实验2结果发现,中央凹点的比例对斜率和韦伯分数都有显著的影响,并且与估算任务一样,时间对斜率的影响消失了。时间对韦伯分数仍有影响,但影响程度大大降低。
ANS估计机制
接下来,作者开发了一个统计模型,该模型允许我们使用人们的行为数据来量化视觉输入的不同成分对数值估计的影响。这个模型以参数化的方式使作者能够测试关于ANS积累如何与视觉行为相关的各种先验假设。首先,作者测试了几个行为测量因素对估计数量µ的可分离贡献。模型推导出各因素的权重。图6A显示了方程式的所有项,每个试验的拟合参数是彩色的,行为测量变量是黑色的。
图6 (A)µ:平均估计;Nfoveal:中央凹点数; Nperipheral:非中央凹点数; Afoveal:中央凹占屏幕中的面积百分比。Aperipheral:非中央凹占屏幕中的面积百分比。Ndouble:每个点算作1次以上中央凹点的数量。每个因素都有对应的参数量化其贡献来估计µ。
(B)参数βfoveal和βperipheral捕获视网膜中央凹和外围对累计计数的贡献。
(C)参数γfoveal和γperipheral捕获被中央凹(Afoveal)和外围(Aperipheral)屏幕面积百分比的标准化后的累积计数。
(D)时间变化下各因素对µ的贡献。
该模型假设有五种成分对µ有贡献。首先是中央凹点(Nfoveal)和非中心凹点(Nperipheral)的数目,它们分别由各自相应的回归参数(βfoveal和βperipheral)加权。此外,作者测试了在首次眼跳后每个注视点算作1次以上中央凹点的数量(Ndouble, 加权参数βdouble)。最后,测量进入中央凹的面积(Afoveated)的比例。
为了使该模型适合于行为数据,作者再次使用了分层贝叶斯模型。通过对推断参数的检查,这让他们可以从三个关键的方面来描述ANS估计的机制:
首先,通过比较βperipheral和βfoveal可以得知积累机制是否更多、更少或相等地依赖于中央凹和外围观察到的小圆点。这又反过来告诉我们,ANS主要是平行进行的,还是中央凹点(即累加)对观测到的估计数贡献更大。
第二,测试βdouble会告诉我们被试是否“doublecount” 重新进入中央凹的点:是(βdouble ≈ 1)或否(βdouble ≈ 0)。这将回答一个关于ANS累加的基本问题:它是基于单纯的视网膜输入,还是基于通过眼跳建立起来的基于空间的世界图像。
第三,被试是根据他们的中央凹面积(γfoveated ≈ 1)重新调整他们的输入,以校正他们有限的视觉样本,还是,估计是一个没有考虑场景的观看量的更简单的累加器(γfoveated≈0)。
图6B显示出了推断的组水平和单被试水平的βfoveal(X轴)和βperipheral(Y轴)平均值。这表明中央凹点的贡献大约是周边点的两倍。此外,βfoveal的值是∼1,这意味着人们在估计中确实将一个中央凹点计为“另一个点”。然而,有趣的是,外围点确实提供了非零贡献,这解释了为什么在非常快的呈现时间下可以进行ANS估计,尽管准确性较低。图6C显示γfoveal和γperipheral接近于零,表明了小面积得重新标准化。这一发现支持了作者的初步假设,即数量估计是基于积累,而不是使用在部分场景中观察到的点的密度进行推断的。最后,所有被试的βdouble都接近于0,表明在同一显示器上多次看到同一个点对估计几乎没有影响。
图6D显示了在不同时间条件下(x轴),各因素对平均估计值(y轴)的相对贡献,这是由模型推断出来的。在0.1秒时,边缘点和中央凹点对估计值的贡献大致相等,在如此短的呈现时间内,它们对估计值的低估程度相当严重。然而,随着呈现时间的增加,中央凹点对估计值的贡献也越来越大,因此周边点在3秒时对估计值几乎没有影响。重复计数在任何时间都几乎不起作用。
总结
该研究表明,ANS(近似数系统)估计在很大程度上是一系列累加机制作用于注视的产物。完整的ANS估计需要整合视觉认知的各个方面,如注意力和眼动控制,以理解将视觉场景转换为抽象的数字的认知机制。该研究可能能够有效的修正我们以往对数字估计这一能力的传统认识,加深我们对人类知觉转化的认识程度。
原文:Cheyette, S. J., & Piantadosi, S. T.(2019). A primarily serial, foveal accumulator underlies approximate numericalestimation. Proceedings of the National Academy of Sciences, 201819956.doi:10.1073/pnas.1819956116