请点击上面“思影科技”四个字,选择关注我们,思影科技专注于脑影像数据处理,涵盖(fMRI,结构像,DTI,ASL,EEG/ERP,FNIRS,眼动)等,希望专业的内容可以给关注者带来帮助,欢迎留言讨论及转发推荐,也欢迎了解思影科技的课程及数据处理服务,可添加微信号siyingyxf或18983979082进行咨询(咨询电话18580429226,杨晓飞)。(文末点击浏览)
在过去的十年中,被称为多体素模式分析(MVPA)的神经影像分析技术迅速普及,特别是在使用功能磁共振成像(fMRI)的社会和情感神经科学研究中。MVPA检查由多个体素激活表征的神经反应的模式,而不是像传统的单变量分析那样分析基于单个体素或区域的值。在这文中,作者为各个层次的社会和情感神经科学家,特别是那些对这种方法不熟悉的人,提供了对MVPA及其最受欢迎的变体(即表征相似性分析(RSA)和解码分析)的实用介绍(使用机器学习的分类)。我们讨论了MVPA如何不同于传统的大规模单变量分析、MVPA给社会神经科学家带来的好处,以及在MVPA分析时需要考虑的实验设计和分析方法。还讨论了如何在自己的数据集中实施具体分析的逐步说明,以及目前使用MVPA方法进行研究面临的问题。本文介绍的内容全面且详细,是上手MVPA分析的佳作。本文发表在Social Cognitive and Affective Neuroscience杂志(可添加微信号siyingyxf或18983979082获取原文及补充材料)。
相关阅读,可点击以下链接了解,增进理解:
Current Biology:视觉想象和视觉感知共享Alpha频带中的神经
与奖赏相关的fMRI解码
大话脑影像之二十四:任务态分析方法总汇
介绍
在过去的二十年中,随着将神经影像数据与社会心理现象联系起来的研究激增,社会神经科学领域发展迅速。在这样一个快速扩展的领域中,随着技术变得更加复杂,对于还没有使用它们的科学家而言,分析方法将变得越来越不可访问(出现脱离前沿技术的情况,因为要付出巨大的学习成本)。本文旨在为广泛的研究人员,尤其是刚接触这种方法的社会和情感神经科学家,提供功能性磁共振成像(fMRI)数据的多体素模式分析(MVPA)的分析实用指南。
传统上,用于分析fMRI数据的单变量方法已用于检查整个研究条件下平均或峰值神经反应的变化。(例如,杏仁核amygdala比中性刺激neutral stimuli对恐惧诱发的激活更大)。这种方法称为“单变量”,因为相应的统计检验每个条件仅考虑一个值(例如区域或体素的平均信号)。近年来,越来越多的研究人员正在考虑使用跨多个体素(称为MVPA)而不是基于单个体素或区域值的反应模式分析。由于在分析和设计MVPA研究时做出的决定会显著影响最终结果,因此必须认真理解和仔细考虑这些问题,而不是仅依赖默认软件设置或常规实验室惯例,这一点至关重要。在这里,我们将通过:
(i)MVPA是什么,为社会和情感神经科学研究提供了什么样的研究机会;
(ii)实施方法的实用解释和提示,着重介绍如何使用这些方法的基础知识;
(iii)使用此方法可以回答的问题类型;
(iv)当前使用MVPA进行研究时遇到的问题。
1.什么是MVPA?
fMRI数据由每个时间点(即TR)在大脑中每个点(即体素)的单个血氧水平依赖性(BOLD)信号值组成。 MVPA不会像单变量分析那样单独查看每个体素,也不会对区域内体素的变化信号进行平均,而是寻找跨体素的神经反应模式信息(图1)。为了说明这种差异,请想象一下在键盘上输入 “狗”和“猫”这两个字。如果仅将键盘按下的次数相加,则发现两个词之间没有区别(即没有单变量效果),但是如果查看被按下的键(即整个键盘上的模式),则会发现不同含义的不同表达模式。以相同的方式,MVPA会检查反应模式中携带的信息,而单变量分析仅考虑反应的整体幅度。虽然考虑多个体素值的分析都可能属于MVPA,但在同一数据集上经常串联使用的两种MVPA变种是解码分析和表征相似性分析(RSA),如下所述。
图1.在单变量分析和MVPA中比较数据。该图说明了在单变量分析(A,B)和MVPA(C,D)中如何使用由四种刺激或实验条件(即,查看年轻人、老人和狗的脸)引起数据之间的差异,以及如何在大脑的每个点测试先验定义的区域(A,C)与(B,D)。每种方法都会得出针对每种条件(右)的数据,这些数据可以用来分析和比较(参见图3和图4)。
(A)先验定义区域的单变量分析使用汇总统计(如平均值或峰值)来描述整个区域的反应幅度。
(B)对每个体素单独进行的单变量分析。
(C)MVPA在事先定义的区域内使用神经反应模式,将所有体素串成一个向量。
(D)在searchlight分析中,在每个体素周围定义一个球体(此处的半径为2个体素),该球体中的反应模式在每个条件的向量中呈串联排列。右侧显示的结果值将用于其他图中描述的分析。
1.1解码分析
解码分析,如分类和回归分析(表1),试图确定是什么条件引起了给定的神经反应。换句话说,传统单变量分析中常见的推理方向——P(大脑|条件)——这在解码分析中是相反的。MVPA解码中经常使用的一种分析是分类,这涉及尝试预测(即分类)哪些类别对应于哪些观测值,例如:生气或惊讶的面孔会引起特定的神经反应吗?
解码分析也包含将数据视为连续数据的方法(如回归分析)。引发给定神经反应的脸有多生气?在这里,我们将以非常笼统的术语描述解码分析;有关更多详细信息,请参见“实践实现”部分。通常,在MVPA中,解码分析需要使用样本外数据预测监督机器学习算法,这涉及将数据分为训练和测试数据集。训练数据集用于训练算法,以区分对应于不同条件(分类)或沿连续尺度(回归)的数据。然后,根据从未见过的测试数据对生成的模型进行测试。也就是说,该算法尝试检测每种条件引起的神经反应模式中普遍存在的系统差异。有多种方法可以实现样本外数据预测,包括k倍交叉验证和交叉分类(请参见“实践实现”部分;表2)。该模型能够正确预测哪些条件在新数据中产生了多体素模式,这反映了这一信息在神经反应模式中的可靠程度。
此类信息可能不会在该区域的整体反应幅度中传递,因此传统的单变量分析会遗漏这些信息。例如,在Haxby等人在其开创性的MVPA研究中,他们向被试展示了人脸,房屋和其他物体的图像。发现腹侧颞叶皮质中的分布式反应模式可以区分几类视觉对象。这包括大脑区域的总体反应幅度没有显著差异的类别,因此不能使用单变量分析进行分离(例如椅子、鞋子、房子)。自从这篇论文发表以来,利用MVPA解码被试的精神状态内容已经迅速扩展,应用范围从解码人们做梦的内容到他们听到的声音,他们看到的面孔和他们想象的人。
1.2表征相似性分析
一阶和二阶同构。
RSA不是直接观察不同类别刺激引起的神经反应模式,而是检查了整个刺激模式的相对相似性。神经反应与刺激之间的直接关系(例如,看到人脸比看到房屋在FFA中引起更多的活动)这被称为一阶同构(图2B),这是大多数神经科学研究的基础。另一方面,RSA考虑了神经反应模式之间的关系,通常将它们与刺激属性之间的关系进行比较(或者,比较个体之间的神经反应模式之间的关系)。两组关系之间的对应关系称为二阶同构(图2D)。为了说明这一点,想象一下广告牌上一张大脸与一张笑脸的小涂鸦图片。脸部特征本身的细节可能在两幅图像中变化很大(即没有一阶同构);但是,每张图片中的面部特征之间的关系在面部的两种表示方式之间是一致的(例如,眼睛比鼻子更靠近鼻子而不是嘴巴;是二阶同构)。以同样的方式,编码某些属性(例如,人脸的存在)的大脑区域可能不会显示出该属性的强度(例如,一张图像与人脸多少相似)与其神经反应之间的直接对应关系,但可能根据该属性显示刺激之间的对应关系(例如,两张脸在人的表情方面有多相似-两个人彼此非常相似,而它们都与长颈鹿非常不同;图2C)和神经反应之间的关系(例如,这三个面孔引起的神经反应模式的相对相似性)。类似地,我们可以比较一个受试者的神经反应与另一受试者的神经反应之间的关系,以测试两个人是否类似地表示刺激。换句话说,在个体间发挥相同功能作用的大脑区域中,相同刺激引起的神经活动强度可能在个体之间显示很少或没有对应关系(图2B),但是这些模式之间的关系可能是一致的(图2D)。
跨模态比较。
为了量化神经反应之间的关系,我们创建了一个表征差异性矩阵(RDM),它显示了由每个条件引起的神经反应模式彼此之间的相似度(图2C)。这样,我们可以描述大脑区域如何区分一组刺激。除了RDM外,我们还可以根据感兴趣的特定属性(例如目标属性,行为评级,模型预测,使用其他模态测量的反应)创建其他RDM,以反映刺激之间的差异。可以将它们与神经RDM进行比较,以测试区分大脑“关心”的区域(例如大脑区域根据人的表情区分面孔图2D、图4)。
图2.一阶和二阶同构。
(A)来自两个被试的神经数据(蓝色和绿色正方形代表体素的反应模式)和三种刺激的行为评级(灰色):一张快乐的人脸,一张悲伤的人脸和一只长颈鹿脸。
(B)测试一阶同构性包括直接比较人与人之间的神经反应模式或与行为评级(例如,测试一张快乐的脸是否在被试中引发相同的神经反应模式或幅度,或者引发更高评级的刺激是否也引发更大的神经反应)。
(C)RDM如何以及在何种程度上捕捉一种量度(例如特定大脑区域的反应,行为评级)区分刺激。
(D)二阶同构测试包括比较刺激之间的关系(即比较RDMs)。在这里,我们看到人与人之间的神经反应或神经反应与行为评级之间没有直接的对应关系(即一阶同构)(B)但是有二阶同构(D)。换句话说,即使被试1和2表现出不同的神经反应模式,两个被试中突出显示的大脑区域也将两个人脸视为彼此相似,但不同于长颈鹿脸。同样,即使该大脑区域的活动量与行为等级(B)并不直接对应,行为数据也表明,在评分维度上与长颈鹿的脸截然不同,反映了神经的不同结构。当直接对应不切实际或不可能建立时,RSA测试二阶同构,从而促进跨人员、测量模式和模型的比较。
如果您对脑影像数据处理,特别是任务态fmri解码或机器学习等感兴趣,欢迎浏览思影科技课程及服务:
第八届任务态功能磁共振数据处理班(南京,3.2-7) 第一届任务态功能磁共振提高班(南京,3.9-14)
第七届任务态fMRI专题班(重庆,1.14-19)
第十四届脑影像机器学习班(重庆,3.12-17)
第三十六届磁共振脑影像基础班(南京,2021.1.6-11)
第十一届磁共振脑影像结构班(南京,1.12-17)
第十九届磁共振脑网络班(南京,1.18-23)
第三十八届脑影像基础班(南京,2.23-28)
第三十七届磁共振脑影像基础班(重庆,1.23-28)
第二十届磁共振脑网络数据处理班(重庆,2月27-3月4日)
第十六届DTI数据处理班(重庆,3.5-10)
思影科技功能磁共振(fMRI)数据处理业务
思影科技弥散加权成像(DWI/dMRI)数据处理
思影科技脑结构磁共振成像数据处理业务(T1)
思影科技啮齿类动物(大小鼠)神经影像数据处理业务
思影数据处理业务三:ASL数据处理
思影科技脑影像机器学习数据处理业务介绍
目镜式功能磁共振刺激系统介绍
数据驱动的表征结构探索。
神经RDM还可以用来探索如何使用多维缩放(MDS),聚类或降维方法(图4B)之类的工具,以数据驱动的方式在特定的大脑区域中构建表示。例如,当使用MDS可视化给定大脑区域中不同面孔的表示方式时,我们可能会发现面孔是按年龄而不是情感聚集的,当仅测试是否可以从中解码出面孔的情感状态时,我们可能会错过这种现象在该大脑区域的反应(即使用监督学习而非无监督学习;表1和2)。以这种方式从数据中发现结构被称为无监督学习。可以看到数据是如何自然结构的,无需强加模型,这意味着RSA比解码分析可以更多地由数据驱动(表1)。
表1:a“监督学习”用于发现一组观察结果和一组标签之间的映射。这就需要训练数据来学习相关的区别,并需要测试数据来评估其准确预测先前看不见的观察结果的能力。“无监督学习”用于发现一组观测值的底层结构/表示形式,不需要任何模型或训练数据。
b解码分析也称为“机器学习”或“统计学习”。这种方法使用算法来学习数据和标签之间的映射。在本文中,这三个术语是同义词。
c虽然某些形式的回归分析用于预测样本属于离散类别的概率(例如逻辑回归),但在本文中,我们使用“回归”一词来涵盖预测连续变量的解码分析。
a请注意,“折叠”(其实就是fold,由于对它的区分有多种方式,所以这里采取一般翻译方法,统称为折叠)可以有多种含义。有些人将用于模型训练和测试的数据集的各个分区分别称为“训练折叠”和“测试折叠”。将数据划分为这些子数据集的行为(即用于训练和测试)也称为“折叠”。最后,“折叠”还可以指仅将数据划分为训练和测试子数据集的单个分区。为了避免歧义,在本文中,我们仅在后者的意义上使用“折叠”。
个人间的比较。最后,RSA提供了一种方法来检查和比较一个被试的神经数据与其他人的神经数据,该数据不受被试之间反应特质的影响(例如,神经反应模式本身的被试之间差异)。也就是说,两个人对一组刺激可能具有不同的反应模式,但具有相似的RDM(图2)。这与许多功能磁共振成像研究人员特别相关,因为将跨被试的功能磁共振成像数据与共同的解剖模板对齐(例如,Talairach空间、MNI空间)可能不够精确。无法在人群中调整精细模式:尽管粗略尺度的功能组织在人群中相对一致,但精细尺度的空间模式可能缺乏大量的人与人之间的对应关系。例如,尽管FFA可能在不同人群中处于相对一致的位置,但FFA中的精细反应模式可能会在整个人中大相径庭。通过从反应模式本身(从而从数据的空间布局)中抽象出来,RSA提供了一种方法,可以在难以或不可能建立直接对应关系时比较模型,建立被试和测量方式之间的表征形式。
1.3.空间映射效应
大多数神经成像研究的一个重要方面涉及到大脑中定位效应。这是通过两种主要方式完成的:基于区域的分析,其中先验定义感兴趣的区域(ROI)(图1A和1C),或者逐点分析(即,MVPA的单变量分析或探照灯进行逐体素分析图1B和1D)。在探照灯方法中,研究人员通常将区域定义为围绕大脑中每个体素的给定半径(通常为8-12 mm)的球体,并测试该球体内的激活模式是否以及如何因条件而异(图1D),然后将所得的测试统计量(例如t值)分配给中心体素。这将产生一个映射,以每个体素为中心的球在不同条件之间的区分程度。值得注意的是,由于探照灯分析中的这种映射过程(与体素分析不同,可以将其视为半径为0体素的探照灯),结果图中的重要体素不直接对应于区分条件的体素,而是球体(由其他体素组成)围绕不同条件进行区分的体素。
1.4.MVPA的好处
多体素模式分析比起分析整体反应幅度,可以为大脑区域如何处理信息提供额外的见解。这是通过考虑可靠的(并且可能是次最大的)反应模式,检查该区域用来区分刺激的物理或概念属性,并阐明对不同刺激的重叠反应的功能意义来实现的。下面将详细讨论这些好处。
对分布式反应模式中携带的信息敏感性。
各脑区域的反应空间分布模式携带了各种信息,而不仅仅是该体素或区域的整体反应幅度。也就是说,即使单独考虑单个体素在各种条件下不会发生显着变化,但该体素的信号可变性仍可能有助于形成可区分条件的可靠反应模式。这些体素被淘汰或以单变量方法排除,但在MVPA中已充分考虑。事实上,使用直接测量神经元活动的研究表明,大脑在分布式神经元群体代码中编码多种类型的信息(即神经元活动模式)。如来自低级感觉信息、运动计划,高级分类信息和主观决策。重要的是,大多数人类的社会和情感神经科学研究都使用间接和相对空间上较粗略的测量方式(例如fMRI),而不是直接测量神经元放电。幸运的是,比较多神经元和多体素群体编码的信息内容工作表明,将MVPA应用于fMRI数据可以提取实际神经元群体编码中携带的许多相同信息。换句话说,即使每个体素包含成千上万的神经元,适用于分布式神经元种群代码的相同原理仍适用于分布式体素模式的级别。
最近,研究人员已经开始通过对测试数据训练解码算法来组合这些方法,以找到特征权重(如反应模式的线性变换),其最好地区分了感兴趣的条件。使用测试数据的加权反应模式,可以使用RSA将转换后的神经数据与特定模型进行比较,从而潜在地提高对这些反应模式中携带的信息的敏感性。这种被称为“混合RSA”的方法在处理低级视觉信息的区域得到了最好的发展。可能会给社会神经科学家带来好处,尤其是当该领域继续开发更好的大脑区域计算模型来处理社会和情感信息时。
揭示大脑区域的信息内容。
MVPA提供了特定大脑区域如何组织信息的丰富特征(即大脑区域对各种类别的刺激做出区分)。例如Peelen在2010年发现内侧前额叶皮层(mPFC)和左侧颞上沟(STS)对使用多种方式(例如,身体,面部,声音)传达的不同情绪线索具有相似的单变量反应,但可以编码表达哪些情绪(愤怒,厌恶,恐惧,幸福或悲伤)在多体素反应模式中保持一致,而无论给定的情感如何传递(即在面部,声音或身体上)。这些结果提供了证据,表明左STS和mPFC以一种与情态无关的方式发出情绪信号,从而根据其抽象情绪值来组织感觉信息。检查反应模式之间的关系如何变化(即在处理的不同阶段,什么样的刺激被视为彼此不同,以及它们在多大程度上被区分)可以提供对信息如何从早期感觉皮层(神经群体代码反映低级感觉属性)向处理的后期(神经群体代码反映更高级、更抽象的类别)转变的洞察。更一般地说,检查与一组刺激或认知状态相关的反应模式的相对可辨性,可以揭示不同大脑区域对神经信息处理的贡献。
测试跨任务,跨领域和不同背景下的相似激活的重要性。
现在许多研究表明,社交奖励(例如称赞,笑脸)和非社交奖励(例如钱,果汁)之间的腹侧纹状体重叠。大脑区域是否真的以相同的方式编码这两种类型的奖励?虽然很难用单变量分析来检验这一点,但MVPA可以通过检查两种奖励在体素上引起相似活动模式的程度来阐明差异。实际上,Wake在2017年发现,社会和金钱报酬也引发了类似的多体素反应模式,这表明他们可能依赖于共享的神经机制来进行报酬表示。在其他情况下,MVPA已揭示功能重叠可能反映了不同的潜在机制。最重要的是,相似的反应模式并不意味着以完全相同的方式表示两个刺激或条件,差异的反应模式也不意味着两个过程在心理上是不相关的。而是,这些相似性是相对的,可以通过评估各种条件或刺激之间的相对差异,获得关于大脑区域功能角色和反应曲线的更详细和细致的图像。
因此,根据分布的空间模式而不是总体大小来分析特定大脑区域内的fMRI反应,有助于揭示这些区域是如何处理信息的。尽管这些精细尺度的神经反应模式被认为对个体而言相对特质,但MVPA也可以在相对较粗的空间尺度上应用(例如,在已进行空间平滑处理并与常见解剖模板对齐的数据上)以揭示在个体中普遍存在的特定精神状态的特征或“生物标记”。 也就是说,单变量分析和解码分析都可以用来解释大脑区域正在做什么(例如。一个区域是否根据给定的特征对刺激做出反应/做出区分?虽然解码分析也可以仅用于样本外预测的目的(例如识别生物标记)。此外,如本文前面更详细描述的,RSA等方法允许研究人员比较来自不同模型、神经成像技术、个体甚至物种的数据。因此,MVPA是一个工具,提供了不同的机会来获得对神经信息处理的见解,而不是传统的单变量方法。
1.5.关于术语的注释
值得注意的是,此处讨论的方法并不是只针对fMRI数据的分析发明的。我们所谓的“解码分析”也称为(监督的)“机器学习”和“统计学习”,广泛用于各个学科和行业。同样,在心理学研究中,分析相似性结构来表征心理和跨模态或跨被试比较数据也有悠久的历史。 “MVPA”只是指使用这些数据分析技术来分析多体素反应模式,这些技术具有悠久的历史和广泛的应用。鉴于任何类型的数据都可以使用解码或相似性分析进行分析,MVPA使用的相同数据分析技术当然可以用于分析其他类型的fMRI数据(如区域平均时间序列;反应时间序列的被试间相似性;功能连接的模式)或来自其他神经成像模式的数据(如fNIRS、MEG、EEG)。就是说,鉴于MVPA特别是指跨fMRI体素的反应模式的分析,在本文中,我们将重点放在解码和相似性分析的应用上,以研究多体素反应模式。在学习更多关于这些方法的知识时,我们鼓励读者以非特定于fMRI数据的方式,寻找专注于这些统计技术的优秀培训资源和参考文献。
2. 实践实现
在这里,我们讨论一般的设计和分析考虑,例如刺激如何在fMRIrun中呈现,何时平滑以及平滑多少,算法选择,超参数调整,以及特征选择。重要的是,关于这些考虑的选择将受到你的研究问题和范式的极大影响,因此需要对你的研究主题和你正在使用的数据分析方法有深入的理解。
2.1表征空间尺度
表征这一观点将对许多方法论,包括与研究设计和数据分析有关的决定,都产生重要的影响。例如,假设功能性大脑组织中的人与人之间的对应关系在更精细的空间尺度上更加有限(如体素到体素),与较粗糙的相比(如区域到区域),当分析被认为以相对精细的空间尺度携带的信息时(如相对细微的视觉区别,如颞皮层区域的面部识别编码,根据相关文献,不同神经元中可能携带任何信息,进行分析的各个方面都是有意义的,这些分析涉及比较每个被试在其本地大脑空间中的神经反应模式(例如,解码,计算神经RDM)(即,无需与标准解剖模板对齐即可避免扭曲))。相关地,感兴趣的信息在细粒度的反应模式中携带,这可能是个体特有的(也就是说,功能对齐方法,例如超对齐和共享反应模型,可以使反应模式在个体之间更具可比性,从而改善这种模式的主体间解码。另一方面,在感兴趣的信息(如被试正在经历的情感状态(其他可能编码在多个大脑区域的相对活动中的信息)被认为是以更粗略的空间模式发出的信号,这可能在人群中更普遍。如果您无法估计感兴趣的神经表征的粒度,在使用其他方法时(如直接神经元记录、元分析)或考虑你的实验目标(如建立一个生物标记与确定一个大脑区域的区别),探索多种可能性并报告所有结果也可能是有用的。
你所研究的现象所表征的空间尺度不仅对数据分析有影响,而且对实验设计也有影响。当研究由相对精细尺度的神经反应模式表示的现象时,这对于每个被试来说可能是相对特殊的,通常需要每个被试进行更多的trial来获得反应模式的稳健估计,并有足够的数据用于解码分析(如,分类分析通常需要在每个被试上独立进行)。另一方面,在较粗的空间尺度上进行的研究可能受益于更大的样本,每个被试的trial可能更少,因为在这种情况下,可以通过聚集被试来估计反应模式。前一种方法(即每个被试的许多trial(样本较少)可用于将每个被试视为他们自己的实验,将所有其他被试视为该实验的复制,类似于心理物理学中常用的方法。还可以测试汇总统计数据(如对应大脑区域的解码准确度)可靠地超过给定值(如基于随机的预期准确度水平)。这种方法类似于上述后一种方法(即每个被试的trial越少,样本越大),这与大多数社会心理学研究更相似,并且对照零来测试整个样本,而不是每个被试。
事实证明,单个因素(感兴趣的表征空间尺度)可能对研究设计和分析都有广泛的影响,很难提供最佳做法的一般建议,因为选择高度依赖于具体的研究。因此,在做出设计和分析决策时,仔细考虑您感兴趣的主题、相关研究如何处理该主题以及您使用的工具和方法是非常重要的。下面,我们讨论MVPA研究设计和分析的其他重要考虑因素。
2.2设计注意事项
由于MVPA测试了不同条件下激活模式的可靠性和系统性差异,因此有必要确保实验设计得到优化,以获得每种条件下的可靠神经激活模式。这需要最小化噪声,甚至在各种条件下对噪声进行采样。
减少噪声。
每个条件有足够数量的trial。正如有足够的被试来尽量减少与小样本研究相关的噪声影响一样重要,MVPA实验每种条件必须包括足够样本(例如trial),来可靠地计算每种条件下每个体素内的典型激活。如上所述,为每个被试提供尽可能多的每种条件示例,对于在汇总各个被试结果之前,要在每个被试内进行模式分析,这一点尤其重要。根据实验设计的信噪比(SNR),所需trial的次数会有所不同,尽管一般来说,只要有足够的trial间隔来模拟诱发的神经反应,trail越多越好。当针对每个条件创建单一的反应模式时,trail没有被平均化,这一点尤其重要。信噪比受多种因素影响,包括扫描仪、采集序列和大脑区域。感兴趣现象的粒度和被比较的实验条件的相对独特性也是重要的考虑因素。例如,进行细微的类别区分,例如不同面部特征之间的区分,通常需要更多的示例/trail,而不是在人与狗的脸部之间进行更明显的类别间区分。
当我们讨论优化设计的机会时,很难给出所需trial次数的一般建议。就像你在不知道效应有多大的情况下,20个数据点就足以进行t检验一样,我们也不建议在不知道由一组条件引起的多体素反应模式之间的差异有多强的情况下进行特定数量的试验。如上所述,算法通常需要更多的样本来学习条件之间更细微的区别;然而,trial次数和刺激间隔之间的最佳权衡可能取决于您的分析方法(例如,更大的间距可能有利于单一trial水平的分析,而更紧密的试验可能有利于平均类别水平的分析)。
解码所需样本数量的另一个关键决定因素是特征(通常是体素)的数量。在类别的实际可分性未知的情况下,一个经验法则是训练数据集中的样本数量应该至少是特征数量的5-10倍。实际上,在功能磁共振成像研究中可获得的样本数量要比这少得多(例如,即使在一个小的100体素的感兴趣区域中,拥有比特征多5-10倍的样本也会转化为500-1000次试验)。由于不可能无限期地扫描被试,我们能提供的最佳经验法则是最大化样本与特征的比率。最大化样本数量的一种方法是在研究参数允许的情况下尽可能多地进行试验和run。另一个策略是使用促进被试之间数据聚合的方法(例如,使用功能对齐来匹配被试之间的精细尺度反应模式;使用粗略的空间尺度的活动总结,例如跨区域而不是跨各个体素的活动模式,如果合适的话)。样本与特征的比率也可以通过减少特征的数量来增加(例如,通过特征选择、降维等。鉴于在神经影像学中,研究通常动力不足,我们建议采用上述策略来最大化样本与特征的比例。值得注意的是,一些算法,如支持向量机,在大量特征的情况下工作得相对较好,除解码之外的方法,如RSA,每个条件可能不需要更多的样本,因为它们不需要将数据划分为训练集和测试集。
减轻噪声的其他方法。除了包括更多的trial之外,另一个最小化刺激相关噪声影响的技术是进行多次短期试验,而不是进行更少次的长期试验。由于噪声在run中是独立的,对这些模式进行平均有助于实现与特定实验条件相关的分布式神经反应模式的稳健估计,这可以改进神经关系模型的估计,并减少噪声对模式分类器的影响。这也最大限度地减少了内部比较中出现的偏差。
噪声的均匀采样。
fMRI的一个潜在陷阱可能对MVPA特别有影响,当噪声系统地与某些条件相关时就会发生。这可能是外部噪声(例如,run之间或实验或run的开始和结束之间的仪器相关噪声差异)或源于被试的行为(例如,一种情况导致被试移动更多,导致信号波动更大)或认知(例如,条件之间的反应时间差异)。这种混淆可能导致看似有意义的结果或其他错误的结论,应尽可能避免。因此:
(1)所有条件都应理想地包含在每次run中,以尽可能均匀地采样信号的变化;
(2)所有条件在每次run中应具有相同的trial次数;
(3)这些试验的顺序应针对您的心理问题进行优化,并最小化顺序效应(下面将详细讨论);
(4)应特别注意避免实验设计中的混淆(例如,任务难度/反应时间或条件之间的外部刺激特性的差异)。
与单变量分析相比,MVPA对噪声更为敏感,因为解码分析将获得任何区分条件的信息,包括由刺激中混杂引起的神经模式的差异(例如,与一个人的研究问题无关的视觉特征,在不同的条件下系统地不同)或与仪器相关的噪声(例如,扫描中条件的不均匀分布)。因此,放大噪声的传统方法可能不够或不合适。功能磁共振成像实验中与仪器相关的噪声的一种常见来源是扫描仪漂移(整个run过程中信号变化缓慢)。通常,减少扫描仪漂移影响的有效方法是通过随机化run中事件的顺序来最小化刺激顺序的自相关性。但是,随机化run中的事件并不总是足以抵消顺序效应或产生最有效的设计。虽然对排序策略的详细讨论超出了本文的范围(但这非常重要,在设计MVPA功能磁共振成像研究时应仔细考虑),但也有其他资源详细讨论了各种选项。一般来说,减轻顺序效应的策略在单变量或模式分析设计的研究之间没有显著差异,但是MVPA结果特别容易受到混杂噪声的影响,因此,在研究设计过程中考虑这些问题可能特别有益。
(MVPA解码方法可以成功区分不同的条件,因为条件之间的反应模式的多元均值存在差异,或者因为这些模式在不同试验中的可变性存在差异。也许与直觉相反,后者可能构成信号而不是噪声(例如,如果该信息被其他大脑区域读出并使用)。然而,条件之间反应可变性的差异也很容易由本节所述的外部因素引起(例如,各种条件之间的差异,即试验如何平均分配给不同的run)。因此,最大限度地减少可能导致不同条件下反应模式均值和变异性差异的因素至关重要。)
2.3分析注意事项
特定于解码分析的注意事项。有许多不同的机器学习算法可用于解码分析。这些算法在根据训练数据系统地分配标签(例如分类中的条件名称;回归中的值)的方式方面有所不同,因此可能会显着影响您的结果。尽管对这些方法的详细介绍超出了本文的范围,但在这里,我们将简要讨论fMRI研究中常用的一些算法。
算法类型。
大多数算法通过对每个特征(通常,体素是使用的特征)设置权重来学习区分条件,这些特征最好地预测对应于数据的正确标签。在常用的线性分类算法中,特征权重描述了每个样本(例如每个观察到的多体素模式)在决策边界上的投影,该决策边界可以最好地将数据分离为正确的条件。在回归中,权重用于根据特征(例如,作为每个体素处的反应的加权组合)来预测连续变量(例如,面孔的年龄)的值。在模型训练期间确定用于预测标签的最佳权重。接下来,在模型测试期间,将新的多体素模式提供给训练后的模型,然后尝试预测对应于该样本的类别或值。该模型在测试数据中的预测性能表明了神经反应模式在实验条件之间的区分程度。
两种常用的线性分类算法是线性SVM和线性判别分析(LDA;表3),它们都确定将数据线性投影到决策边界的每个特征的权重,该决策边界将数据最大程度地分为相应的类别。通常,LDA(假设所有变量均呈正态分布且具有相同的方差)是通过找到最大化类间方差相对于类内方差的解来实现的。线性SVM学习通过试图找到超平面(即边界),它根据数据点的类别来分隔数据点。在类别完全可分的情况下,这是通过最大化超平面的边界(即任一类别的最近数据点与决策边界之间的距离)来实现的。因此,只有最接近决策边界的样本(也称为“支持向量”,因为它们支持划分超平面)才是线性支持向量机中定义决策边界的样本。因此,远离决策边界的样本(例如,明显属于类别或异常值的多体素模式)没有影响。相反,当使用其他方法时,如LDA,所有样本都会影响决策边界的定义(表3)。
其他一些常用的分类算法只是为每个样本分配来自训练数据(最近邻分类)的最接近样本(例如,基于多体素反应模式之间的相关性或欧式距离)的标签,或者为训练数据(k近邻分类)或训练数据中多元均值(即质心)最接近的类别(表3)。因为最近邻方法基于所有特征的模式之间的距离,并且对所有特征进行同等加权,所以这些算法通常在执行特征选择(下面将更详细地描述)之后工作得最好,以便基于最有信息的特征来计算距离(从而进行分类)。
重要的是,在解释由训练好的分类器或回归模型提供的特征权重时,应该非常谨慎(例如,在给定的算法中,哪些体素对算法最重要,大脑区域或探照灯球)。由于体素不是彼此独立的,体素可能从一些算法中接收到低(或零)权重,因为它对区分条件的模式没有贡献,或者它可能只是携带冗余信息。也就是说,有时,如果测试区域内的另一个体素被赋予更大的权重并携带相同的信息,则体素被赋予零权重;其他时候,相关体素的权重作为彼此相关的体素数量的函数而降低。相对体素权重还将受到分析之前是否已对每个体素的数据进行归一化(即平均值为0,标准误差为1)的影响。因此,解释所产生的权重通常很困难或产生误导。
过拟合。
在以前未修改的测试数据中评估模型性能总是必要的,并且在fMRI中尤其重要,因为通常特征比样本多得多。事实上,尽管在一个感兴趣区域中有数百或数千个体素是很常见的,但每个被试的试验数量如此之高却是罕见的。因此,它通常会导致某些组合加权,使得模型在训练数据中表现很好,而不能很好地推广到新数据,即将模型过拟合到数据并产生误报。除了具有比样本(通常是试验)更多的特征(通常是体素)之外,另一个可能增加过拟合风险的因素是模型可以多灵活地符合数据的形状。因此,通常优选使用相对简单的(例如线性的,而不是非线性的)模型。
超参数调整。
另一个重要的分析注意事项与超参数调整有关。从训练数据中学习模型参数的值(称为特征权重),而其他参数(称为“超参数”)控制这种学习的方式,因此需要在训练模型之前进行设置。需要设置的超参数以及要考虑的合理值范围因算法而异。例如,在k-最近邻分类中,在标记测试模式(即k)时要考虑的相邻模式的数量是要设置的相关超参数。类似地,线性SVM具有正则化超参数C,该参数控制权衡最大化训练数据中的预测精度与最小化特征权重范数(即最大化超平面的余量)之间的权衡。应该在训练数据中调整超参数,以确保模型在测试数据上表现良好。如果您未明确设置模型超参数的值,则大多数软件包将使用默认值(例如,SVM的C的默认值通常为1),但无法事先知道用于特定问题的最佳值。查找在特定数据集中为模型带来最佳性能的超参数的过程称为“超参数调整”。通过调整超参数,研究人员可以以数据驱动的方式确定理想的超参数,而无需基于将要进行推断的同一数据做出这样的决定,从而提高了灵敏度,同时降低了假阳性率。在实践中,这种方法可以促进探索性但受约束的方法。例如,可以预先注册要考虑的一组超参数值,同时仍然使用(训练)数据将这些值的最终选择校准到当前数据集中。
执行超参数调整的最简单方法是通过“网格搜索”,网格使用来自用户的指定列表(或'格')。必须在每个折叠的训练数据集中分别执行超参数调整过程(即嵌套交叉验证;图5),这有可能导致不同的折叠选择不同的超参数。如图5所示,您可以将训练数据进一步划分为子训练和验证数据集(请参阅“数据拆分”部分),并在较小的训练数据集中使用许多可能的超参数值重复进行模型拟合,以确定哪些超参数值在验证数据集中表现最佳(仍在训练数据之内)。以这种方式选择超参数后(即训练数据中的超参数调整),您将在对整个训练集进行算法训练时使用这些值,然后最终评估其对测试数据的预测性能。
图5.带有超参数调整的新k倍交叉验证。交叉验证包括将数据迭代地分为训练和测试数据集,在训练数据上训练算法,然后在测试数据上测试结果模型。对于数据的k个分割中的每个分割(即折叠),可以在该折叠的训练数据内执行超参数调整。为了执行超参数调整,可以将训练数据进一步分为多个“子折叠”,其中包括子训练和验证数据集。在这些“子折叠”的每个子折叠中,对每个超参数集的算法进行训练,然后对验证数据进行测试。一旦在每个“子折叠”中测试了每种独特的超参数组合,就将选择在整个验证数据集中(在训练数据内)具有最佳性能的超参数集。然后,将所选的超参数集用于对该折的整个训练数据集上训练算法。然后以该倍数的测试数据对生成的模型进行测试。每次折叠都会重复此过程(即k次)。最后,计算所有测试数据集上算法的平均性能。
2.4 RSA特有的分析注意事项
RDM距离度量。
创建神经RDM时,我们必须计算每对反应模式之间的差异(请参见下面的RSA分步说明)。通常这样做的方法是先计算对应于相似性的皮尔逊相关系数r,然后将其转换为对应于不相似性的相关距离1-r。重要的是,还有其他方法可以定义两个神经反应模式之间的距离。其中包括欧几里得距离(通过对每个体素的差值求平方,求和这些值,然后取平方根来计算),马氏距离the Mahalanobis distance(类似于经过归一化的欧几里得距离)和来自解码分析的分类精度(其中分类器为区分两个条件将意味着这些条件之间的距离为零)。这些不同的指标对数据的不同方面敏感。例如,当比较多体素模式以生成神经RDM时,皮尔逊相关距离仅对空间模式的差异敏感,而对整体神经反应幅度不敏感,而欧氏距离对两者均敏感。它们还可以提供不同程度的可靠性(例如,连续测量要比离散测量更可靠,例如分类精度)。
一般分析注意事项:处理和选择特征。
在本节中,我们将讨论与预处理和体素选择有关的注意事项。以下注意事项适用于解码分析和RSA,“特征”一词专门指的是机器学习算法使用的预测变量。对于大多数功能磁共振成像研究,体素(或体素的转换)是标准特征。
使用哪种体素汇总统计。一旦对数据进行了预处理,通常会使用血液动力学反应函数的一般线性模型(GLM)来针对每种情况或刺激创建一个对比图(即图像)。此对比图中的每个体素表示在该条件的所有试次中(或针对该试验,在模拟了单个试验的情况下)在该体素中引发的神经活动的平均估计水平。与任何GLM一样,将计算β统计量和t统计量,二者均可用作特征量度。β是GLM产生的原始值(即血液动力学反应函数和状况之间关系的量化)。 另一方面,t值通过将每个值除以试验的标准误差来衡量这些β值。因此,如果一个特定的体素在整个试验中的神经活动存在很大差异,则t值会惩罚这个体素(即体素将具有较低的t值)相比于具有相同β值但在试验中波动较小的体素(即该体素将具有更高的t值)。这种将β值换算成t值的方法有助于模式检测。
如何以及何时平滑。
平滑是空间平均的一种形式,它通过将相邻像素的加权值相加来重新计算每个像素的信号(这些权重以及平滑中包括多少个像素由高斯核确定)。单变量分析中的空间平滑通常作为预处理的一部分进行,以减少噪声并增加信号检测(即功率)。但是,这减小了信号模式的粒度,并且可能会干扰MVPA的使用。因此,通常建议在预处理过程中不使用平滑或使用最小平滑,并且仅在进行一级模式分析后使用平滑。此外,由于被试之间的解剖对应关系要比被试内的解剖对应关系少(并且当图像之间的空间对应关系较低时,进行平滑处理更有利),因此在整个一级(即对象内)分析中通常使用未平滑(或最小平滑化)的图像,然后在进行二级(即组级)分析之前进行平滑处理,从而增强跨人群检测结果收敛的能力。平滑程度取决于任务的类型或相关心理过程的定位方式。
特征选择。
在大多数情况下,全脑mask用以去除无信息的体素(例如脑室中的体素;不在特定感兴趣区域中的所有体素)。有时,您可能希望使用基于独立数据集或元分析(例如,来自neurosynth.org的独立研究或功能本地化)的功能掩码。特征选择(即选择指定体素)有助于降低数据的维数(其中多体素模式的维数与它所描述的特征/体素的数目同义),并增加对感兴趣问题的敏感度。减少特征的总数也有助于减少执行分析所需的时间,并降低解码分析中过拟合的风险。
重要的是,特征选择通常必须在单独的数据上定义(即未包含在训练和测试数据集中的数据)与用于模式分析的数据(即无二次使用no double dipping),以避免由于利用研究人员自由度的循环分析而导致的误报。例如,不适合基于数据集中的所有run来创建对人脸做出反应体素的感兴趣区域,然后使用MVPA来测试该感兴趣区域是否显著区分同一数据中的人脸和其他图像。相反,数据的独立子集(例如来自不同run或被试的数据)通常必须用于体素选择和模型测试。
如果研究人员希望将相同的数据用于特征选择和解码分析,则应在训练数据中针对每个数据折叠独立的进行特征选择。可以在每个训练数据折叠内独立评估不同的特征选择策略和/或阈值(通过将每个折叠的训练数据划分为训练和验证集,类似于并可能与超参数调整相结合,图5)。当然,重要的是不要对将要进行推断的数据(即测试数据)尝试多种特征选择策略。
降维
特征选择通过选择要包括在模型训练中的特征子集来减少模型中的特征数量,这被称为降维,通过将它们转换成更少的维度来减少模型中的特征数量。例如,主成分分析(PCA)将特征转换一组正交值(即主成分),允许相关变量(例如体素)由较少数量的成分来解释。在模型训练之前,您可以指定您希望在模型中保留多少成分作为特征,或者您希望保留的成分的比例。您可以通过探索训练数据中的不同可能性来决定如何设置这些阈值,使用与上面讨论的超参数调整中描述的相同的嵌套数据折叠技术可以实现这一过程。降维技术,如主成分分析,有利于从功能磁共振成像研究中常见的特征比样本多得多的情况,转变为模型中特征少得多,但仍保留整个特征集中包含的大部分信息的情况。就像特征选择一样,这有助于防止模型与训练数据过度匹配。此外,将彼此相关的特征转换成较少数量的正交分量对于改善当特征彼此独立时表现最佳的算法的性能是有益的(例如。朴素贝叶斯,一些线性回归算法)。
2.5分析步骤
现在,我们将讨论如何在您自己的研究中实施MVPA。现在有几种软件包可用于帮助研究人员使用MVPA方法,包括基于python的软件包[例如Nilearn,它有助于将scikit-learn用于神经成像数据(https://nilearn.github.io),PyMVPA(http:// www.pymvpa.org),BrainIAK(https://brainiak.org/)] ,以及MATLAB工具箱[例如CoSMoMVPA(http://cosmomvpa.org),用于RSA的工具箱(http://www.mrc-cbu.cam.ac.uk/methods-andresources/toolboxes/license/)]。每个软件包的默认方法或参数以及某些测试的run方式都有些不同。以下是runRSA和线性SVM分类分析的分步说明。为了清楚起见,我们将通过一个简单的实验来描述这些步骤,在该实验中,被试可以看到不同年龄的人和狗的面孔。前两个步骤始终是必需的,而随后的步骤(即步骤3及其后)则根据执行的是(A)分类还是(B)RSA而有所不同。
步骤1.定义条件。在我们的示例中,我们将考虑由四种不同刺激引起的反应模式条件:婴儿和成人以及狗的照片。假设这些条件下的刺激在10次run中的每一次中出现多次。我们可以对每种情况(产生40个样本)或个别试验(因为每次刺激均提出多次刺激)进行模型化反应。
(请注意,如果实验顺序未完全随机化,则应仅在run之间比较反应模式以进行解码和相似性分析;)对此问题进行进一步讨论)
步骤2.选择感兴趣的区域。接下来,我们必须确定要测试的大脑区域。不管要测试的区域数量如何,分析都会分别在每个区域上进行(有关选择特征的讨论,请参见上文)。也就是说,如果分析单个大脑区域(或一组大脑区域作为单个ROI),则该分析仅run一次,而全脑探照灯分析完成的次数与大脑中存在体素的次数相同。在本节的其余部分,将描述显著性测试之前的所有步骤,就像在单个被试的单个ROI中进行一样。
对于每个条件,所选区域内的体素被系统地重新排列成每个条件的向量,使得结果向量中的第一个体素对应于每个条件下大脑中的相同点(图1C和D)。
分类分析。如本文前面所述,分类算法在数据的一个子集上迭代训练,然后通过交叉验证在独立的数据子集上测试。
步骤3.数据拆分。将数据集划分为训练和测试数据的最简单方法是保留方法,您可以选择数据的一个子集进行模型训练,选择一个子集进行模型测试(例如,将一半试验用于模型训练,将另一半用于模型测试)。尽管此方法既简单又快速,但是训练和测试集的定义(即哪些trial恰好在数据的任一部分结束)可能对结果有很大影响。因此,更常见的是使用k折叠交叉验证,其中将数据多次(k)次划分为训练和测试集,并在数据的每个子集中执行训练和测试过程(表2 ,图5)。 k个子集中的每个子集中的数据一次用作测试数据,而k-1次用作训练数据。对于给定的折,通常建议在训练集中保留10%到20%的数据。例如,使用5倍交叉验证,我们10次run的fMRI研究的数据将分为5个子集(例如,第1-2、3-4、5-6、7-8、9-10个子集),每个子集将被用作测试数据一次,并包含在训练数据中4次。留一样本交叉验证是k折交叉验证的一种形式,其中k是样本总数,类似地,在留一样本交叉验证中(图3),k是功能磁共振成像研究中的run次数。如果可以在被试之间汇总模式信息,则也可以选择留一被试交叉验证。
为了避免算法偏向于预测一个特定的类别,一个简单的策略是在每次run中每个类别都有相同数量的样本,并使用留一交叉验证(图3)。在我们的研究中,这相当于10折交叉验证,来自我们四个刺激中的每一个的数据在每个训练集中出现9次,在每个测试集中出现一次。
如果对此数据执行特征选择或超参数调整,则每个折叠中的训练数据必须分为子训练和验证子折叠(即嵌套交叉验证;图5)。在这些子折叠的每一个中,算法在子训练数据上训练,并在验证数据上迭代测试,以找到最具预测性的特征和/或最佳超参数。在训练数据内的每个子折叠上完成这种迭代测试之后,选择最佳超参数(和特征,如果在训练数据内进行特征选择的话)来在训练算法时使用,即。当确定该折叠的特征权重时(参见步骤4)。请注意,此过程可能会导致在每个折叠中使用不同的特征、特征权重和超参数。
步骤4.训练模型。
在每个训练集中,我们用正确的标签标记样本,并将此信息提供给我们的算法。本质上,该模型将每个多体素模式视为多维表示空间中的一个点,以使每个体素对应一个维度(图3)。也就是说,此空间中的样本坐标由每个体素的值定义(即,x值是体素1的大小,y值等于体素2的大小,等等)。如果我们的样本中有m个体素,则我们有一个m维空间。该算法尝试选择模型参数,以便为样本分配最正确的标签。
步骤5.测试模型。训练完模型后,我们为算法提供测试数据,该数据不带任何标签。该模型基于这些新样本相对于从训练数据估计的边界(如在SVM学习中)或相对于训练数据中其邻居(如在k-最近邻居分类中)落在表征空间中的位置来对这些新样本中的每一个进行分类;表3)。然后,我们计算它在分类过程中所犯的错误数量,并计算该模型的分类准确性。尽管分类准确性是fMRI数据MVPA解码成功的最常用方法,但有时可能更喜欢其他方法,例如ROC曲线下的面积。某些类别在数据中过多代表的情况可能会导致较高的分类精度从而对研究人员产生误导,因此不同条件在同一个run中出现的次数要进行平衡。
图3.分类分析。
(A)在每个参与者中,对参与者数据的一个子集(此处为10个run中的9个)使用训练算法,然后对先前未见过的子集进行测试。在训练阶段,每个样本(这里是每次run中每个条件的多体素模式)都被视为代表性空间中的一个点。每个样本的坐标由每个体素响应的幅度定义(即,体素1的响应幅度=沿轴1的坐标等)。本研究中使用的算法尝试在空间中定义边界(在线性SVM学习中,是(m-1)维超平面),以便每个样本都使用其正确的标签进行分类(请注意,图示为仅是一个概念性示例;有关特定分类算法如何工作的更具体讨论,请参见正文。
(B)在训练数据上校准模型参数后,然后向算法提供从未见过的测试数据(即没有正确的标签信息)。根据这些样本在表示空间中的位置,算法会根据从训练数据中学到的区别对它们进行分类。如果对测试数据的分类不正确,则视为错误。
(C)计算每个参与者的所有数据折叠的平均准确度。(D)对每个参与者重复此过程,然后将组级别的准确性与基于随机机会所期望的准确性进行比较。
接下来,将测试集的平均分类准确性与随机机会所期望的结果进行比较(例如,如果有两个相等的抽样类别,则为50%-请注意,小样本量可能会错误地提高机会准确性)。如果分类确实高于偶然性,则表明该大脑区域的反应模式可以区分类别,换句话说,此大脑区域“包含有关”这些类别的信息。
表征相似性分析。步骤3.创建RDM。 RDM表示刺激(或条件)之间的相对差异。对于N个刺激,它是一个N×N矩阵,每个行和列对应于一个刺激。对应于第i行和第j列的单元格是刺激i和刺激j之间的差异(即相异性,距离)。
步骤3a.神经RDM。为了创建神经RDM,我们将与每个刺激(或条件)相关的神经反应模式与其他刺激的神经反应模式进行比较。因此,我们首先通过平均每个run过程中每个刺激的神经反应模式来获得每个刺激的单一反应模式(而不是每个run刺激一个反应模式)。神经反应模式可以通过计算每对神经反应模式之间的皮尔逊相关距离1-r来构建反应模式,但是也可以使用其他距离度量(参见RDM距离度量部分;图4A)。理论上,相关距离越高,大脑区域就越能区分这两个概念。
一旦计算出,这些距离值就会组织成一个RDM。请注意,这将导致对角线上的对称矩阵,因为人类婴儿和狗婴儿之间的差异与狗婴儿和人类婴儿之间的差异相同。还要注意,对角线都将为零,因为每个条件都与其自身完全相关,因此相关距离为零。如果比较两个RDM,则零的对称性和对角线将错误地增加整个RDM之间的相关性,因此仅提取RDM的较低的非对角线三角形以进行进一步分析(图4A)。
步骤3b.非神经RDM。为了确定神经RDM的结构对应于什么,我们可以将其与从被试数据(例如,感知年龄;图4C),客观数据(例如,物种;图3E)或从模型生成的数据(例如,例如假设的年龄和物种相互作用)进行比较。在我们的示例中,我们可能想测试大脑区域是否按照感知的年龄来组织面部。根据每个被试的感知年龄创建行为RDM,我们可以针对每对条件计算被试年龄等级之间的绝对差,然后将其组织成矩阵并提取下对角三角形(图4C)
步骤4a(选择1).比较神经和非神经RDM。现在,我们可以测试一个人的行为RDM预测该人的神经RDM的能力。这通常是通过关联两个RDM的下三角形来实现的(图4D)。请注意,由于行为RDM和神经RDM可能使用不同的比例,因此使用Spearman相关而不是Pearson相关来确定它们的对应程度可能是有益的,因为这并不假定线性关系。如果您要测试多个预测变量(例如,各种刺激属性),则可以将它们输入RSA回归,并通过检查相关的β系数来测试每个预测变量RDM在其他预测变量之上预测神经数据的性能。与感知年龄相关的β系数将反映年龄预测物种以外的神经数据的程度。
步骤4b(选择2).可视化RDM。 RDM也可以用于可视化数据结构。可视化RDM时,通常会根据其值对每个单元进行着色以直观地指示哪些条件被类似地表示(例如,图2和4中的较浅颜色),哪些条件被更不同地表示(例如,图2和4中的较暗的颜色)。 MDS之类的技术也可以用于查看数据的整体结构。 MDS根据它们之间的相似程度在低维空间中绘制数据点:引发相似反应模式的两个刺激被紧密地绘制在一起,而引发不同反应模式的两个刺激被更远地分开绘制(图4B)。这可以帮助识别刺激在大脑中的组织方式(例如,狗的脸可能聚集在一起,并且在特定的大脑区域可能与人的脸分开)。
图4.表征相似性分析。表征相似性分析(RSA)可用于创建(并经常进行比较)RDM,以汇总(A)神经,(C)行为和(E)基于模型的数据。
(A)为了创建神经RDM,将在特定区域内每种条件引起的神经反应模式相互比较,以估计其相对独特性(例如,它们之间的相关距离1-r)。这些距离被组织成神经RDM。由于RDM保留关于零的对角线对称的,因此仅提取该矩阵的非对角线下三角形,可以(B)使用MDS在低维空间中将其可视化,或者(D)与行为相异结构矩阵进行比较。
(B)MDS图通过绘制更接近的条件来可视化差异结构。在这里,我们可以看到人脸聚在一起并且与狗脸分开(即不相似)。我们还可以看到,似乎存在年龄的影响,例如,年轻的面孔彼此相似,并且与年长的面孔分开。
(C)可以通过建立行为差异结构来检验感知年龄的这种影响。这是通过找到每对面孔的感知青年之间的绝对差异来实现的。同样,提取非对角线下三角形。
(D)经常使用Spearman相关性将神经RDM和行为RDM的较低的非对角线下三角形相互比较,因为它不假定RDM之间存在线性映射。该相关系数被映射回该区域,从而创建神经数据与行为评级匹配程度的映射。
(E)物种的模型RDM反映了两个图片是否属于同一物种。
(F)可以在回归中将多个RDM作为预测变量,并且可以将生成的β映射回ROI,作为该变量在其他预测变量之上和之外预测神经数据的指标。
统计测试。完成上述步骤后,就可以进行显著性测试了。在许多情况下,这可以通过与单变量实验中相同的方式来完成:例如,探照灯分析的结果具有与其他统计参数图相似的数据结构(例如,每个体素处的一个值),因此可以经历相似的情况统计测试(比如T检验)。当然,您使用的确切方法将取决于数据的详细信息。例如,重要的是要确保所使用的测试适合于数据值的范围和分布。由于相关系数和分类精度值以0和1为界,因此适合对其进行转换(例如使用反正弦变换)或使用非参数检验(例如置换检验)。
RSA或解码分析结果的统计显著性可以在每个被试内部或跨被试进行评估,这些方法被用于测试不同的问题。更具体地,MVPA结果的被试内显著性测试,评估该被试的数据(例如神经RDM与基于模型或行为的RDM的相关性,解码准确性)不同于零,而受试者间的显著性测试评估这种影响是否以及在多大程度上不同于基于激活的估计(类似的单变量分析)。
被试内测试。通常,被试内部的显著性测试需要多次进行多次的随机修改被试数据中与所有样本相关的标签来完成随机置换的检验(例如,用于在RSA中创建RDM并包含解码分析中的训练数据的模式)。然后在每次迭代中执行相关的统计测试(例如,置换后的神经RDM与模型RDM的相关性,分类分析)以创建一个空分布,可以将真实的测试统计数据(从非混洗数据生成)与该空分布进行比较。如果结果超过此零值分布中的临界值(例如,对于a = 0.05,为一尾,则结果大于95%时,则显着),则认为结果显著。
跨被试测试。测试跨被试的MVPA结果的显著性可以通过测试来自相应ROI或统计参数图的数据对单变量研究中的各个被试的显著性来完成。应当注意,如果为每个被试获得了体素方向的结果(例如探照灯分析),并且对每个被试的原生空间中未平滑或最小平滑的数据执行了解码分析和/或RSA,则每个被试的数据应与解剖结构对齐,并且有可能在进行组级显著性测试之前进行其他空间平滑处理(进行配准和空间平滑)。
3.MVPA我们可以问什么问题?
在本节中,我们将讨论特别适合MVPA的研究问题的类型。为了清楚起见,我们将继续考虑示例实验,其中被试在进行fMRI时考虑了不同年龄的人脸和狗脸。
3.1大脑加工信息
许多研究人员对被试当前正在思考或关注的事物(即“大脑阅读”)具有内在的兴趣,因为确定被试处于何种认知状态的能力可以提供有关在哪里以及如何对信息进行神经处理的有价值信息。在上面的示例中,我们使用分类分析来确定人们考虑的是人脸还是狗脸。如果我们能够根据给定大脑区域中引发的反应模式成功地训练一个预测模型来解码此信息,那么在该区域中人脸和狗脸(或某些协变量)的表示方式可能存在根本差异。这可以提供有关大脑如何编码此类信息的宝贵见解。
3.2神经处理的阶段
我们还可以研究信息在通过不同大脑区域时是如何转换的。在MVPA的好处部分,我们讨论了一项研究,该研究提供了证据,证明左侧STS和mPFC根据其抽象的情感价值代表情感,而与情感表达的方式无关,以及一般来说,我们如何使用MVPA来阐明大脑在不同处理阶段的进展,表征在整个大脑区域中如何变化。例如,这种方法可以说明信息从早期的感觉皮层向后期处理的过程中如何进行转换。可以通过将每个大脑区域的神经RDM与模型RDM(例如,是否以相同的方式呈现两个刺激)进行比较,以查看哪个模型在每个阶段最匹配来进行测试。我们还可以通过绘制带有MDS的神经RDM来可视化差异。这可以使我们看到在每个神经处理阶段如何表示刺激。
3.3潜在的神经认知机制
在分步说明中,我们讨论了如何在示例中使用RSA来发现大脑区域按年龄和物种对刺激进行聚类,以及如何使用显著性模型对其进行测试。也就是说,RSA允许我们测试给定大脑区域使用什么类型的信息来组织状态或刺激表示。解码分析可以与RSA互补使用。使用交叉分类,我们可以询问人脑是否以同样的方式来表征对跨物种面部识别中年龄的效应。交叉分类涉及在一个条件下训练模型(例如根据年龄区分人脸),然后在另一个条件下测试模型(例如。根据年龄区分狗的脸)。如果该模型在经过人脸训练后能够可靠地解码狗脸的年龄,那么在这个区域可能存在编码不同物种年龄的一致的潜在模式。这表明,在这一处理水平上,人们以类似的方式表征人脸和狗脸的年龄。
3.4个体差异
是不是每个人看待世界和处理世界的方式都是一样的?就像单变量分析一样,个体差异可以与任何类型的MVPA相结合,以更好地理解个体是如何处理信息的。也就是说,MVPA的结果可以用来预测个体差异。比如Ersner-Hershfield等人在2009年发现,现在和未来自我之间有更大连续性的个人为退休储蓄更多。例如,我们可以通过一项功能磁共振成像研究来追踪这一过程,通过检查被试现在和未来自我相关的反应模式的相似性。这些反应模式的相似性可以反映未来的自我延续,从而预测退休储蓄。在研究个体差异时,MVPA是一个有用的工具,因为这些差异可能表现在神经模式的独特性上,而不仅仅是一个区域的总体反应幅度。
4.MVPA中的问题
尽管像任何数据分析技术一样,我们主要关注MVPA的好处,但仍需要考虑一些重要的问题和潜在的陷阱。例如,在解码分析中,除了解释一个区域能否区分刺激之外,很难解释关于模型本身的任何东西。 MVPA还引入了很多的研究人员自由度。
重要的是,MVPA不是单变量分析的替代品。例如,许多实现MVPA的方法对各种条件下的ROI区域的平均幅度变化不太敏感,而单变量分析很容易捕捉到这种变化。此外,重要的是要考虑到两个条件可能会引起相似的单变量反应,但会引起不同的多体素反应模式。这不一定意味着这些条件在心理上没有共同点,也不意味着它们没有共同的处理需求。这样,两种技术可以互补的方式使用。在本节中,我们描述在计划和解释MVPA时可能需要考虑的问题。
4.1我们在衡量什么,内容或过程是什么?
在MVPA和单变量分析中很难确定刺激特征的表现,神经编码何时反映了这些特征本身的计算或表示,以及何时反映了特征计算过程的系统性(或者微妙性)影响。例如,许多以前的研究表明,与计划和执行动作相关的顶叶和运动前区的活动与观察工具相关;该活动是否反映了工具概念本身的编码部分,或者通常遵循工具识别的下游过程(例如未来行动的预测),是正在进行的辩论主题。因此,相同的结果可能被一些作者解释为信息编码,而被其他作者解释为受该信息影响的过程。同样,如果解码分析可以区分人和狗的脸,但仍不清楚大脑区域是否对这些刺激的内容进行了不同的编码(例如物理特征)或者该结果是否反映了其他相关过程中的差异(例如行为预测、知识检索)。
4.2超越静态多体素反应模式
在某些情况下,研究人员可能对随时间推移而展开的心理过程的神经基础感兴趣,而不是对感知的即时反应 (例如某人明显的情绪状态)或检索到的知识(例如某人所属的社会团体)感兴趣。在这种情况下,可以适当地使用功能磁共振成像数据的特征来捕捉反应如何随时间变化,例如多体素模式如何随时间推移而消退和流动或功能连接模式如何在不同的任务或条件下变化。MVPA也可用于分析功能连接的模式。使用功能连接模式表征task-evoked fMRI的好处是,每个特征是两个大脑区域的反应时间序列的相关性(例如杏仁核和前额叶皮层之间的功能连接),这与体素不同,这些特征是从数据的空间布局中抽象出来的,因此很容易在被试之间推广。这样,在分析功能连接的模式以解码心理过程或状态时,可以轻松地在被试之间聚合数据,这可以大大增加可用于解码分析的训练数据量,进而增加机器学习算法学习条件之间的区别能力。
4.3被试内和被试间的解码
如上所述,解码分析通常受益于有很多的训练数据,以学习条件之间的区别,并且实现此目的的方法是可以在被试之间很好地对齐反应模式。这包括使用功能连通性模式而非多体素反应模式进行解码的情况,以及采用功能对齐方法的情况,或者使用RSA生成特征以在“相似性空间”而非“体素空间”中解码。除了有助于被试间解码以产生较高分类精度的技术趋势(由于可用的训练数据量增加)之外,研究人员也希望被试间解码方法在预测新个体的情况下同样具有实际益处。
4.4成像分辨率
尽管MVPA可以检测到比大多数单变量fMRI分析更细粒度的空间尺度上承载的信息,但与分析单个神经元的方法相比,它仍然相对粗糙。已经证明神经元活动的模式携带多种信息,但是每个功能磁共振成像体素包含数十万个神经元。因此,虽然与单变量测试相比,我们在MVPA中获得了一些细微差别的信号,但我们却缺少了在更精细的空间尺度上承载的信息。
检查多体素而不是多神经元,可以系统地产生假阳性和假阴性。 fMRI数据相对较低的空间分辨率可能会在MVPA的背景下产生误导性的结果,在某些情况下可能导致假阳性,而在另一些情况下可能导致假阴性。例如,猴子的神经生理学研究表明,眼眶额叶皮层中附近大部分不重叠的神经元编码着社会和非社会奖励的价值。鉴于成千上万的神经元以多体素模式包含每个体素,因此在fMRI数据上使用MVPA(或单变量分析)来研究此类现象可能会导致研究人员错误地推断出常见的编码方案。这在任何情况下都可能是一个问题,在这种情况下,不同但相近或相互交叉的神经元群体会编码不同种类的信息。
另一方面,分析多体素模式而不是多神经元模式也可以系统地产生假阴性。 Dubois在2015年比较了猴子观察脸部时fMRI数据的单个单位和多体素模式的种群分析。可以从多神经元反应模式中解码人脸的身份和视点,但是使用MVPA可以可靠地解码人脸的视点,而不是身份。这似乎是因为,在空间上表达面部表情的细胞在集群中紧密聚集,而表达面部识别特性的细胞在空间上聚集较弱。因此,当神经元对于给定刺激维度的选择性不强聚集时,fMRI数据的MVPA可能对实际神经元群的编码所存在的信息不敏感。
4.5关于社交和情感过程时间的不确定性
在研究社交和情感过程的神经基础时,研究人员有时不确定心理过程何时发生。例如,如果给被试一个8 s的窗口来重新评估一个压力事件,那么可能很难或不可能确定在该8 s窗口内该重新评估过程的开始,结束和持续时间是何时发生的。在这种情况下,研究人员应如何采用MVPA方法?一种选择是简单地从整个块或事件中估计多体素反应模式,就像对单变量分析所做的那样,然后将这些事件模式提交给MVPA。另一种选择是估计一个块或事件中每个时间点的多体素反应模式,然后在每个时间点分别执行解码或RSA,以测试在被试之间可靠地存在区分条件信息的时间。请注意,这种方法假设被试和事件在当前心理过程的时间上是一致的。
如果人们认为心理过程的时间因人和事件而异,并且研究人员不希望为整个事件估计一个单一的多体素反应模式(即上面概述的第一种选择),则会出现并发症。例如,当生成要分析的多体素模式时,将为每个事件选择大量的持续时间和开始组合。尝试每种事件的开始和持续时间的不同可能性不仅需要大量计算,而且必须校正大量统计测试。一种策略是将每个事件中不同时间点的多体素反应模式连接到一个较长的特征向量(即单个样本)中,然后使用监督学习来识别哪些时空特征区分条件。尽管这种方法假设心理过程发生的时间分布在各个事件之间具有一致性,但是如果在每个被试中分别进行,则它将允许被试之间心理过程的时间异质。我们鼓励与此类问题有关的研究人员探索正在开发的新兴方法,以分析比fMRI具有更高时间分辨率的神经影像学方法,因为它们可能适用于功能磁共振成像,并促进对神经反应模式的时空动力学与心理过程之间的关系进行更广泛的考虑。
总结:
在本文中,研究者旨在为各个层次的社会和情感神经科学家(尤其是这种方法的新手)提供一种流行且实用的分析方法,即多体素模式分析或MVPA的流行分析方案。通过与常用的单变量分析进行比较,本文解释了MVPA是什么,并探讨了可以用MVPA回答的不同类型问题,介绍了在自己的数据中实施MVPA所需的实际步骤和注意事项。许多研究已经讨论了具体分析的细节,这些细节在这里更一般地被提及,后续应该对其进行更加实践性地研究,以更深入地了解这些工具(例如RSA,解码分析)以及实施它们的新方法(例如,基于模式的生物标志物;大脑区域之间的表征连接;实时解码的神经反馈)。近年来,MVPA迅速普及,随着这些技术以新的方式扩展和应用,我们将能够使用神经影像技术来探索社会和情感神经科学领域的许多新型问题。但具体实践仍旧需要更多地指导和练习!