1. 摘要
转化神经科学的一个主要目标是识别精神病理学的神经相关因素(“生物标志物”),可用于促进诊断、预后和治疗。这一目标已经导致了对精神病理学症状如何与大规模的大脑系统相关的大量研究。然而,这些努力还没有产生在临床实践中使用的实际生物标志物。这一令人失望的进展的一个原因可能是,许多研究设计关注的重点是增加样本量,而不是在每个个体中收集额外的数据。这一焦点限制了任何一个人的大脑和行为测量的信度和预测效度。由于生物标记物存在于个体的水平上,因此更加关注在个体中验证它们是有必要的。我们认为,从个人内部的大量数据收集中估计出来的个性化模型可以解决这些问题。我们回顾了来自两个迄今为止独立的关于(1)精神病理症状和(2)大脑网络功能磁共振成像测量的个性化模型研究的证据。最后,我们提出了跨两个领域的方法,以改进生物标志物研究。
2. 背景
在转化神经科学中,识别“生物标志物”或神经相关的精神疾病一直是一个既定的目标,这些疾病可用于促进诊断、确定预后和改善治疗。这一目标主要是由于目前在精神病学中使用的诊断疾病学的缺点,其中疾病的症状往往在诊断和治疗结果之间重叠,即使对接受相同诊断的人也高度可变。这一问题的一个例子是诊断重度抑郁症和广泛性焦虑障碍的标准,这两种标准都包括相同的疲劳和睡眠障碍的症状。部分应对这些共享诊断特性在不同的疾病,生物标志物的识别是研究领域的中心目标标准(RDoC)计划:努力在临床神经科学识别精神病理学症状的神经基础,更好地定义诊断类别在精神病学。通过这一努力和类似的努力,临床神经科学已经集中于发现大脑功能的个体差异,这些差异可靠地与精神症状共同变化。
生物标志物研究中常用的一种方法是磁共振成像(MRI),它可用于非侵入性地测量人脑的解剖和功能,并跟踪它们与症状严重程度的关系。来自核磁共振成像研究的证据表明,精神病理学的症状不仅与脑损伤的改变有关单个大脑区域的功能,但也可以来自于大脑的许多分布区域的相互作用。鉴于这一证据,功能连通性MRI(fcMRI)已经成为研究精神病理学的一种突出的方法。利用功能磁共振成像的研究已被用于识别具有相关活动的大脑区域的“网络”,如默认模式网络。利用这项技术,许多研究发现了大脑网络的改变和精神疾病症状之间的联系。例如,来自许多研究的证据发现,默认模式网络区域之间的连接强度增加与抑郁症状之间存在关系。总之,这些发现强调了在精神病理学中脑功能的分布性改变的存在。
然而,尽管MRI很有希望,但使用MRI的生物标志物研究迄今为止主要产生了较小的大脑行为关系,这些关系只能在数千名参与者中可靠地测量。这些来自大样本数据集如HCP数据集、英国生物样本库和青少年大脑认知发展(ABCD)研究表明,用于生物标志物研究的典型研究设计可能不是识别可操作的诊断和干预目标的理想选择。在这里,我们假设这些之前的努力的一个主要局限性是,它们在很大程度上依赖于基于每个参与者相对少量的数据的群体水平或横断面推断。
在这篇综述中,术语“群体水平”广泛地指描述个体数据的方法,这些方法明确地对不同的测量进行平均(例如,比较个体群体之间测量的平均得分)。在这里,我们还使用这个术语来包括分析数据的方法,这些方法人为地将个体间的测量值等同起来,以满足统计分析的某些假设。这个假设的常见例子是,相同的分数自我报告测量抑郁症状代表相同水平的精神病理学在两个不同的人,或者大脑区域的功能定义在组的个人概括到任何一个人。虽然这些例子没有明确地平均人们之间的数据,但它们的等价假设可能会扭曲了我们对人群中这些测量中个体间变异的真实程度的理解。
正如我们将在本综述中进一步讨论的,在组水平的研究中,每个参与者通常收集的数据量,大脑网络和行为的测量可靠性较差,无法捕捉到有效的针对特定的人的大脑和行为特征。这意味着,大多数关于生物标志物的研究都不能通过设计来确定特定个体内部的症状和神经基质之间的可靠关系。因此,这些群体水平的研究设计只能间接推断出他们观察到的关系实际上在个体水平上保持不变——生物标志物理论上存在的分析水平。
例如,考虑上述抑郁症状和默认模式网络连接之间的元分析联系。虽然群体水平的方法平均可以回答关于人的研究问题,但它们没有处理个体水平功能的潜在相关方面(见表1)。这对于在被试之间使用群体水平分析的研究问题是正确的(例如,组间测量的平均得分有显著差异吗?)而在被试内部(例如,在时间点1的平均得分与在时间点2的平均得分有显著差异吗?)研究的设计。为了提供可操作的预后和治疗指标,生物标志物研究必须能够回答诸如以下问题,如谁从特定的治疗中获益,以及多久后的治疗开始改进吗?哪些症状将这些人与那些从治疗中获益的人区分开来?如果不在个人层面上直接回答这些问题,群体层面的结果对任何个人的普遍性都是未知的。
鉴于生物标志物研究中群体水平分析的这些局限性,我们可以质疑RDoC框架中概述的精确诊断和治疗目标是否可以使用典型的群体水平生物标志物研究设计来实现。为了应对这些局限性,我们建议生物标志物的研究应该将个体作为分析的主要单位。这一重点的一个潜在方法是个性化(或“精确”)模型:这里定义为从广泛抽样的个体参与者中获得的大脑功能和行为的估计。先前的证据表明,个性化模型可以在个体参与者的层面上产生可靠和有效的数据,而不依赖于个体间的数据池。因此,对个体参与者的广泛测量可以直接解决人的内部机制的异质性,这被认为是精神病理学和大脑功能的基础。
在这篇综述中,我们主要关注最近在精神病理学症状和功能磁共振成像领域构建个性化模型的努力。这是一篇叙述性综述,因此所纳入的论文的选择并不是详尽的,而是为了强调个性化模型在生物标志物研究中的潜力。虽然在这些领域中使用个性化模型通常是相互排斥的,但我们讨论了这两个研究领域中类似的总体主题,并提出了在未来的研究中结合它们的策略。虽然这里的重点是明确地在精神病理学和功能磁共振成像的测量,这里涵盖的问题与许多其他生物学测量和行为表型相关。本综述的第一部分集中于证据表明通过群体水平的方法对人们之间的数据进行平均,掩盖了关于大脑网络和精神症状的个体差异的重要信息。第二部分集中于个性化模型可以提供的关于精神症状和大脑网络如何随时间动态变化的见解。在最后一节,我们提出了结合神经成像和精神病理学个性化方法的未来方向和研究设计。
3. 不同被试之间的平均数据可能掩盖大脑和行为上的个体差异
许多传统的群体水平实验设计试图确定特定群体之间是否存在显著差异或特定变量之间的关系。这是在许多关于精神病理学症状和fcMRI的研究中采用的最常见的设计,包括在引言中提到的大数据研究。虽然在许多情况下,这种跨群体具有理想的效果,如减少测量误差和增加统计能力,但这些好处取决于平均数据的潜在属性。在基础数据中存在大量个体间差异的情况下,跨个体汇集数据实际上会导致效度和/或信度的降低。因此,精神病理学和功能磁共振成像测量的一致和实质性的个体差异的证据将给生物标志物研究带来一个问题,它人为地聚集或等同于这些测量。
在本节中,我们回顾了使用个体化的功能磁共振成像和精神病理学模型的研究,以检验不同参与者之间这些测量的个体差异程度。我们将讨论个体间的异质性和有效性的问题,这些问题阻止了传统的群体层次方法在个体中提供这些测量的准确表示。我们认为,这一证据表明,生物标志物的研究将受益于更加关注在个体水平上测量大脑功能和精神病理学。
3.1 个体化的功能连接模型可以更好地区分不同个体的大脑组织之间的差异
在神经科学领域,对大脑结构和功能的非侵入性神经成像研究有助于阐明认知、情感和行为的神经基础。由于这些过程在精神病理学中被改变,更好地理解它们的潜在机制可以帮助识别驱动精神疾病的神经基质。最近,人们越来越清楚,这些内部状态和行为背后的神经基质并不仅仅依赖于大脑的单个区域,而是跨分布的大规模大脑网络相互作用的产物。根据这一证据,许多关于临床人群中大规模大脑网络的研究已经确定了与精神病理学的重要关系。
先前的神经成像工作已经证实,使用功能磁共振成像,可以对人类参与者的大脑网络进行非侵入性测量。这种方法可用于测量网络,如默认模式和额顶叶,这些网络已被证明分别参与了内部导向的认知和认知控制等过程。许多研究在不同的参与者组中重复了这些网络的存在,确定当fcMRI数据在参与者组中平均时,他们的地形是相对一致的。过去的研究表明,在整个人群中,大脑功能组织有许多共性。
尽管有这些共同之处,最近来自“精准”功能磁共振成像的证据有助于阐明不同个体的大脑网络组织的许多差异。精准功能磁共振成像是指通过对单个个体进行广泛抽样获得的大脑活动和大脑网络的个性化模型。这种广泛的采样对于获得个体大脑功能的可靠估计是必要的,因为少量的数据fcMRI估计可能会相当嘈杂。在许多以前使用功能磁共振成像的研究中,这种局限性需要采用群体水平的方法来定义大脑网络,以产生稳健的结果。
这一局限性值得注意,因为最近的功能磁共振成像研究表明,虽然地形有共性,但一些大脑网络位置显示个体的巨大差异。事实上,到目前为止,所测量的每个个体在fcMRI中都表现出可靠和实质性的偏差,这些偏差没有反映在组定义的功能图谱或网络地形估计中。当从每个个体中收集到大量的fcMRI数据时,这些特殊变异的区域已被证明是可靠的,这表明它们不是测量误差的结果。此外,它们似乎不能归因于个体间大脑结构的大体解剖差异、运动伪影或将功能磁共振数据注册到共同大脑模板的错误。总之,这表明,个体的大脑网络存在可靠的特殊差异。
这些大脑网络空间布局的个体差异的存在对于解释功能磁共振成像的测量具有重要意义。这是因为在大多数群体水平的fcMRI分析中,为一个数据集中的所有参与者选择了相同的坐标种子区域(或功能分割,例如,Power et al.,2011中确定的264个区域)。在使用这些方法来计算功能连接时,我们假设大脑的各个区域在参与者之间的空间布局上是相似的。在群体水平分析的这一假设下,fcMRI的个体差异通常被解释为一组特定区域之间连接强度的变化。
然而,由于个体间的大脑组织是可变的(例如,图1a和图1b中的白色圆圈),这一假设在实践中可能被违反。这是因为区域间fcMRI强度的差异并不是任何观察到的差异的唯一合理解释,因为大脑网络地形图的个体差异也可以改变功能连通性的估计。例如,虽然下顶叶(即图1中的白色圆圈)通常被认为是默认模式网络的典型区域,但在任何一个个体中,该区域实际上可能不会与默认网络强耦合。此外,个体之间功能网络地形的不同程度因大脑网络而不同,进一步使群体水平研究的解释复杂化。因此,典型的功能磁共振成像强度的估计是不能实现的分离观察到的结果是由于大脑网络空间范围的个体差异,还是由于类似区域之间的功能耦合程度。
图1. 个体(被试1和2;B)大脑网络组织与群体水平的估计(A;Power et al.,2011)的差异例子。个体大脑网络地形不同的区域用白色圆圈表示,每个个体与群体水平网络不同的区域用黑色圆圈表示。代表每个网络的颜色显示在左下角。
为了用真实数据来说明这个问题,一个来自午夜扫描俱乐部(数据集的两个参与者(参与者1和参与者2)的例子(图1)。在这个数据集中,在10个阶段中,从10个个体中采样了大量的静息态功能磁共振成像数据,得到了每个个体大脑网络的高度可靠的地图。在本图中,如果选择图1b中顶叶内小叶上的白色圆圈作为fcMRI分析的感兴趣区域,参与者1(上)与默认网络的其他区域(红色)的耦合可能少于参与者2的相同区域(下)。在一个小组水平的研究设计中,这一发现将被解释为参与者1(相对于参与者2)在默认网络中的连接强度降低。然而,功能磁共振成像数据从个性化模型表明,更可能的解释是这两个默认网络区域之间的差异在参与者1:(红色)默认网络区域包含几乎整个区域(白色圈)而参与者的相同的位置2包含一个默认的区域小得多的网络。大脑网络空间布局中这些个体差异的存在,使得群体水平研究设计中fcMRI强度测量的解释变得复杂。
鉴于这一局限性,值得注意的是,尽管有大量的群体水平的研究检查了精神疾病患者的fcMRI,但对于fcMRI的改变如何与精神病理相关仍没有共识。尽管在重度抑郁症的研究中经常观察到默认网络内的连通性增加,最近的一项大样本调查发现了默认网络内连通性下降的证据。在精神分裂症的研究中也观察到类似的矛盾结果模式,在不同的研究中,相同网络之间的功能连接强度的增加和减少。
这些研究之间不一致的一个可能原因是,它们是群体水平的研究设计,缺乏由个性化功能磁共振成像提供的对个体参与者大脑网络的分辨率。因此,这些研究不能将大脑网络空间地形图的个体差异与这些网络连接强度的差异区分开来(见图1)。由于大脑网络的空间地形和连接强度的个体差异2可能有不同的功能相关性,无法单独测量它们,污染了任何识别大脑网络连接和精神病理之间联系的尝试。
多项研究表明,脑网络地形图的特殊差异与认知和行为的个体差异有关,这表明它们对生物标志物的研究具有重要意义。支持网络地形中的个体差异与认知和行为的相关性的一个证据来自于它们发生的空间位置。大脑网络中的个体差异最常发生在多模态关联网络中,这些多模态关联网络的活动与不同的高阶认知过程相关,而在视觉和运动区域等单峰处理网络中也最少发生。这种定位表明,它们可能是这些复杂功能的个体差异的基础。
进一步的证据表明,与任务相关的激活位置(在MRI扫描仪中收集)很大程度上符合个性化大脑网络的地形边界。例如,语言处理任务已经被证明会在个性化语言大脑网络范围内优先增加功能磁共振成像活动,尽管这个网络的空间位置在人之间不同。这些结果表明,网络地形图上的个体差异与正在进行的任务表现相关的大脑活动的变化有意义地相关。
一些研究还发现,有证据表明,考虑大脑网络的空间地形可以改善对扫描仪外收集的行为测量的预测的研究表明,他们发现个性化大脑网络对情绪、认知能力和个性的预测明显优于典型的群体水平方法。Kong等人的另一项研究使用了”超对齐”,这是一种通过控制大脑网络地形的局部个体差异来对齐参与者的fcMRI模式的方法。这些对功能连通性的超对齐估计能够解释相对于fcMRI研究中通常发现的认知能力差异,证明了该方法在未来研究中的前景。总之,这些研究表明,与通常使用的群体水平的方法相比,个性化的大脑网络模型更适合于识别与行为表现型的关系。
另一种建立大脑网络个性化模型的方法集中于所谓的“网络变异”,即个体相对于群体水平网络的极端偏差。网络变体的定义为与不同大脑网络相关的连接模式,而不是在给定位置的典型预期(例如,图1a中的黑色圆圈封装了默认网络(红色)区域,而是包含了图1b中个体参与者的其他网络片段)。大脑皮层的这些区域通过大量的数据(> 40 min)显示出较高的可靠性(r > 0.8),这表明它们不太可能是测量误差的副产品。变体也显示了任务状态和休息状态之间的高度对应关系,表明了它们在不同任务需求之间的稳定性。使用这项技术,最近的一项研究表明,具有更多默认模式网络变体的参与者报告了终生药物滥用增加和较低的积极生活经历。由于这些行为与精神疾病的症状相关,这表明网络变异可能是精神病理学的生物标志物。
虽然功能磁共振成像的个性化测量的使用相对较新,但初步证据表明,这种方法在识别与精神症状的关系方面具有实用价值。研究使用个性化的方法来识别大脑网络已被证明优于群体水平的方法估计fcMRI的方法和强迫症,重度抑郁症、精神分裂症和双相情感障碍症状之间的关系。因此,早期证据表明,fcMRI的个性化测量所提供的个人特异性信息与生物标志物的研究直接相关。
除了精神病理学的自我报告测量,类似的工作也检查了fcMRI测量和从手机数据中被动收集的指标之间的关系。最近的一项研究发现,通过GPS数据测量,躯体运动网络中的连通性与参与者的行动能力的个体差异有关。此外,其他神经成像模式,如脑电图(EEG)也与被动收集的数据一起使用,以显著预测一个月内的抑郁症状。虽然在当前的综述范围之外,行为的被动测量和其他神经成像模式也值得提及,作为使用个性化模型的生物标志物研究的有前途的未来方向。
总之,这里回顾的工作表明,fcMRI中可靠的个体差异存在于个体之间,而这些特性并不能通过群体水平的fcMRI分析来很好地描述。此外,在多个研究中,通过解释功能磁共振成像中的这些个体差异,与群体水平的方法相比,可以更好地预测行为,包括精神病理学。因此,虽然在fcMRI中使用个性化模型仍然相对较新,但现有证据表明,与组水平的分析相比,它更适合于测量fcMRI和精神病理学之间的关系。这种方法的早期成功相对于群体水平的分析,假设网络地形在参与者之间是不变的,这表明了fcMRI在精神病学生物标志物研究中的个性化模型的前景。
3.2 对精神病理学症状结构的群体水平的估计可能不适用于个人
虽然到目前为止,本节关注的是使用群体水平的功能磁共振成像分析来量化大脑网络中的个体差异的缺点,但有证据表明,在精神病理学的测量中可能存在类似的问题。在研究背景下,精神病理学的症状通常被作为分类诊断或通过症状的自我报告测量进行评估。虽然这些症状评估的方法可以显示出良好的心理测量特性,但他们共享这样的假设,即他们测量的结构在个体之间是不变的。例如,在分类诊断的情况下,精神疾病的症状通常被假定属于一个单一的基础结构,它是根据患者对有关多种可能症状的问题的回答计算出来的。由于这些症状被认为是同一潜在单一结构的可替代指标,即使是出现多种不同症状的个体也可能符合同一疾病的标准。
最近,提倡在连续体上测量症状的精神病理学维度模型已被广泛采用。不变性假设也是这些维度模型的基础,因为这些模型中概述的精神病理症状的因素和相关结构被假设在个体之间大致相同。因此,这些量化精神病理学的方法都有这样的假设,即尽管特定疾病的症状表现可能因个体而异,但每个人的症状之间的关系可以用相同的潜在结构来近似。
假设精神疾病的结构在个体之间是不变的,那么可以预期,一个给定的个体经历的疾病症状的严重程度应该共同变化。换句话说,如果两种症状都与一个特定的障碍相关,或者在一个维度模型中有意义地相关,那么如果一个症状在一个人身上恶化,另一个症状也会恶化。违反这一假设——即在个体之间存在可变的症状结构——将使使用群体水平的研究设计来测量精神病理学复杂化。对于生物标志物的研究尤其如此,因为症状之间关系的个体差异可能与不同的生物学机制有关。因此,了解从群体水平的方法估计的症状模型与个体参与者的症状模型的一致性是很重要的。
在过去的十年里,已经开始有证据表明,精神病理学症状的结构在个体之间可能是异质性的。在Wright等人的一个例子中,该人对101名符合任何人格障碍标准的参与者进行了跟踪,连续100天对其症状进行每日调查(见图2)。当他们分析这些自我报告数据的群体水平结构时(随着时间的推移而崩溃,以及因素分析跨参与者的数据,类似于最典型的群体水平横断面设计),出现了两个因素:内化和外化(图2 A)。不出所料,这一因素结构反映了先前基于精神病理学组水平横断面自我报告数据的报告。作者还对这些数据进行了纵向建模,并发现四个因素最符合数据:消极情绪、分离、敌意和去抑制(图2B)。因此,组级的结果指向了横断面数据中的双因素结构模型,以及纵向数据中的四因素结构模型(尽管该解释的一些注意事项见第4.5节)。
图2. 精神病理学结构差异的一个例子显示了使用自我报告数据生成的模型从(A)组级设计平均时间(横断面),(B)组级设计平均参与者(纵向),或(C)模型适合个人参与者的数据跨时间(个性化)。明显的变量(如V1)以正方形表示,从这些变量估计的潜在因素(如外部化)以圆圈表示。各因素之间的显著相关性用双头箭头表示。在不同层次的分析(即A、B、C)中,由明显变量产生的因素和各因素之间的相关性显著不同。例如,虽然横断面数据是两个广泛的因素(A),但当数据是纵向(B)时,四因素解决方案更适合。重要的是,个性化模型(C)中的因素之间的相关性与横断面(A)或纵向(B)模型中报告的都不相同。这些相关性在个体之间也有所不同(C;参与者1和参与者2),这提供了证据,表明在精神病理症状的结构中存在有意义的个体差异。
然而,从这些结果来看,还不清楚这两个群体水平的模型如何适合个体参与者。为了解决个体间差异的问题,Wright等人随后将这些相关结构与使用个性化模型的个体的纵向数据进行了比较(图2 C)。尽管迫使个体的因素解决方案与组水平的纵向数据相同(如图2B所示),但这些因素之间的相互相关性在个体之间是不同的。例如,参与者1的个性化模型显示,敌意与去抑制有关,脱离与消极情绪有关;而参与者2的模型显示,去抑制与脱离直接相关。这提供了证据,表明个体内部的因素结构可以显示出个体间的差异,因此可能不一定匹配由群体水平的数据产生的精神病理学结构。
值得注意的是,在Wright等人的研究中,个体水平上的症状数据在100天内显示出良好的稳定性,通过平均反应的稳定性(平均r = 0.85)和反应的变异性(平均r = 0.72)来衡量。这表明,通过个性化模型获得的精神病理学的个体差异很可能代表了精神症状的稳定特征样测量,而不是测量误差的人为因素。进一步支持这一观点的是,对其他样本的精神病理学纵向测量也获得了类似的可靠性估计。通过模拟个体水平的纵向数据,也提供了类似的证据。因此,本研究表明,个性化的精神病理学模型可能捕获稳定的个体差异,这些差异并不等同于那些使用群体水平的方法获得的差异。
其他研究进一步支持这一种观点,即群体水平设计可能不能充分代表单个个体的精神病理结构。在一项这样的研究中,Fisher收集了10个符合广泛性焦虑障碍标准的个体的数据。这些参与者完成了一项至少60天的每日调查,评估DSM-5(美国精神病学协会,2013)定义的广泛性焦虑障碍症状以及相关的回避行为,积极准备可能的负面结果、拖延和寻求安慰。使用探索性和验证性p技术因素分析,使用潜在因素基于个体的纵向症状数据来估计个体内部的个性化模型。与Wright等人不同,每个个体的数据(图1C)与组级纵向数据(图1B)都被相同,在这里,因素解决方案允许不同。基于这一分析的结果,Fisher得出结论,在10名参与者中,只有2名包含一个接近DSM-5中广泛性焦虑障碍症状的因素;没有参与者具有与该组中其他参与者相同的潜在症状因素。这表明,如果允许因素解决方案在参与者之间有所不同,那么症状数据的结构在个体之间可能比应用这个约束更多变。
除了识别精神病理结构的个体差异,早期证据表明个性化模型可能对选择治疗干预有实用价值。在最近的一项研究中,Fisher等人使用了个性化的精神病理学模型来指导被诊断为焦虑和情绪障碍的个体的治疗选择。这是通过检查从每个个体的个性化模型中获得的每个因素所解释的方差,并从最能映射到这些症状的治疗方案中选择模块来完成的。作者发现,他们的抑郁症个性化治疗的估计效应量略大于类似的荟萃分析(Hedges g=1.86, 95%CI = [1.48 2.24])估计治疗效果(Hedges g=1.69, 95%CI = [1.48 1.89])。有趣的是,当比较每个阶段的改善效应量时,这些效应量之间的差异更为明显,Fisher等人报告的平均改善量是约翰森和弗里堡的两倍(Hedges g = 0.24)。虽然只是初步的,但这表明基于个性化模型的治疗可能在开始治疗后比一刀切的方法更早提供好处。然而,在本研究中,没有招募对照组接受标准化治疗(或基于精神病理学的组水平模型的症状进行治疗),因此不能直接推断个性化干预与典型治疗的疗效。未来的研究将需要进一步建立个性化模型捕获与治疗相关的精神病理学信息。
总之,这些结果表明,症状结构的异质性可能存在于不同的个体之间,即使是那些符合同一精神障碍标准的人。因此,如果假设被诊断为某一特定疾病的个体具有相似的症状相关性结构,那么这种假设在许多情况下可能会被证明是不正确的。虽然我们在这里只强调了一些研究,但其他人也报告了类似的结果。总之,这表明,在生物标志物研究中,从群体水平的设计到个体,可能缺乏精神症状结构的普遍性,值得给予更多的关注。
4. 量化个体内部大脑功能和精神病理的测量如何随时间的变化对于生物标志物的研究至关重要
在生物标志物研究中,测量方法最重要的品质之一是其可靠性。这是因为信度与一个度量与另一个变量的最大关系成正比:信度差的度量与另一个度量的最大可能观察相关值的上限较低。这对于评估在生物标志物研究中观察到的典型的小效应量是至关重要的,因为它们是由大脑和具有不同可靠性的行为测量之间的关系强度所决定的。
一个测量的可靠性可以通过多种方式进行量化,包括参与者之间的内部一致性和参与者内部重复测量的相似性。一种量化单一测量显示参与者之间内部一致性程度的方法是分半信度,它比较了参与者之间相同测量的两半结果的相似性。相比之下,信度的另一个方面关注参与者在重复测量中结果的相似性,例如重测信度,它量化了不同时间点之间测量的相关性。在生物标志物研究中,对参与者内部一致性和参与者内部测量的时间稳定性的全面理解是至关重要的,因为这些属性对于正确地背景化大脑测量和精神病理学之间的关系是必要的。
为了更好地理解这些测量特性是如何将我们对生物标志物的理解结合起来的,我们可以考虑重度抑郁症中抑郁情绪的时间特征。一般来说,虽然情绪被概念化为在相对短暂的时间尺度上波动的短暂状态,但持续经历负面情绪的倾向与抑郁风险的升高有关。因此,虽然任何给定情绪状态的重测可靠性可能在较长的时间尺度上不稳定,但经历负面情绪的倾向可以显示出更长期的时间稳定性。因此,为了了解重度抑郁症的潜在基质,有必要分别识别与稳定特征(即神经质或经历负面情绪的特征倾向),与并发抑郁发作(即由于临床显著的精神病理而导致的消极情绪的持续体验)。如果不梳理这些大脑功能的独立关联,我们对重度抑郁症的实例化机制的理解就不能被认为是完整的。由于这些机制存在于个体的水平上,因此也有必要了解这些精神病理学的时间可分离方面的神经相关性的个体间异质性的程度。
在本节中,我们回顾了大脑网络和精神病理学的短暂状态和稳定特征方面的研究。首先,我们回顾了研究瞬态和稳定因素对功能磁共振成像数据的贡献的研究,并讨论了个性化模型改进了我们对大脑网络中这些方差来源的测量的证据。接下来,我们回顾过去的工作,检查短暂和稳定的特征方面之间的精神症状。再次,我们讨论了这些测量中个体差异的证据,以及它们如何阻碍我们对精神病理学潜在机制的理解。总的来说,我们认为分离大脑和行为的状态和状态特征对于改善精神病学的生物标志物研究至关重要。
4.1 个体内部可靠的功能磁共振成像数据对于分离功能连接的特征和状态方面是必要的
测量的可靠性和稳定性问题与fcMRI尤其相关,因为过去的工作已经证明,MRI数据的采样变异性很高。换句话说,使用少量的fMRI数据产生具有高变异性的fcMRI测量(近似于多元正态分布),导致的估计不能代表功能连通性的真实值。这导致fcMRI测量显示低fMRI数据的重测可靠性。与这一观察结果一致的是(以及大多数研究中收集的少量功能磁共振成像),最近的一项荟萃分析发现,研究中fcMRI可靠性的平均估计较差(ICC = 0.29)。这种较差的可靠性意味着大脑网络中的个体差异很难用少量的fcMRI数据来准确地描述这些个体差异,这使得这并不是个体差异研究的理想衡量方法。
对于理解在个体水平上获得可靠的fcMRI测量所需的数据量的重要贡献来自于“精确”的fMRI实验(之前在第2.1节中介绍)。在这些实验中,从每个个体中收集了多个扩展阶段的fMRI数据,而在更典型的设计中获得了5-10min的fMRI数据。精确功能磁共振成像能力的早期演示来自My连接体数据集,其中一名参与者在大约一年半的时间里完成了104次功能磁共振成像扫描。在本研究中,通过fcMRI定义的皮层大脑网络可以在单个参与者中获得较高的重测信度(r>0.95)。重要的是,劳曼等人证明,需要超过30 min的数据才能获得这些可靠的估计,这表明个性化的fcMRI估计可以在大量(或“精准”)的数据下变得稳定。
在午夜扫描俱乐部数据集(之前在2.1节中提到)中观察到类似的结果,在10次试验的10个个体中取样了大量的恢复状态功能磁共振数据。在该样本中重复了大于30 min数据的高可靠性模式(r > 0.85)。对fcMRI可靠性的其他估计与这些发现一致,表明使用少量数据(6 min),重测可靠性(ΦUV = 0.18)明显低于大量数据(144 min)(ΦUV=0.65)。还应该注意的是,功能MRI估计的任务相关激活遵循与fcMRI相似的模式,即每个参与者收集的大量数据增加了受试者内的可靠性。因此,在个体内部收集大量的功能磁共振成像数据已被证明可以产生可靠和个性化的大脑功能估计。考虑到在生物标志物研究中使用可靠的个性化测量方法的好处,这些结果表明,扩展的fcMRI数据收集方法对于更好地理解行为的神经关联至关重要。
除了在个体中产生可靠的测量方法外,其他研究表明,个性化功能磁共振成像模型可以用于从短暂状态样因素中分离稳定的特征样方面。如前所述,在临床应用中,一个重要的考虑因素是能够跟踪使他们易于发生精神病理学的个体的稳定的神经特征,如经历抑郁发作的倾向。这是至关重要的,因为大量的证据表明,在许多疾病中存在一种稳定的类似于精神病理的脆弱性。使用精确功能磁共振成像估计的个性化大脑网络已被证明在不同会话中是稳定的和任务状态,表明它们代表了大脑组织的稳定的特征标记。
根据这一证据,Gratton等人表明,功能磁共振成像测量主要由参与者之间的共性和稳定的个体特征所主导。作者还发现了fcMRI测量中跨天数和认知状态的短暂变化的证据,但这些影响在幅度上明显小于更稳定的特征。重要的是,虽然存在与更微妙的瞬态样因素相关的显著差异,但在fcMRI中观察到的最大状态效应是个体特异性的。因此,利用组水平方法的fcMRI方法并不适合测量这些瞬态变化。
尽管这是一个相对较新的研究领域,但确实有证据表明,个性化的功能磁共振成像非常适合追踪个体内部大脑网络的变化。在一个特别引人注目的例子中,Newbold等人对三名健康成年人的优势手臂使用了手臂石膏。正如通常观察到的那样,在基线时,双侧躯体运动皮质之间存在高度的功能耦合,这主要负责计划和执行运动。然而,在没有任何投射手臂损伤的情况下,该手臂对应的三个个体的躯体运动皮层的特定区域显示出与其他躯体运动区域的实质性脱钩。一旦移除石膏,受影响区域的fcMRI逐渐恢复到基线水平。功能磁共振成像的这些显著变化在使用石膏后48小时内开始,显示了在相对较短的时间内跟踪成人大脑变化的潜力。
另一项跟踪fcMRI随时间变化的研究是普里舍等人,他收集了一名神经典型女性在月经周期中持续30天的功能磁共振成像。在多个大脑网络之间观察到全脑连接和雌激素和孕酮水平的一致波动,表明这些激素水平在整个月经周期中与大脑网络连接的变化共同变化。这一结果再次表明,精确的功能磁共振成像方法可以用于检测随着时间的推移,大脑网络的细微但显著的变化。
除了跟踪几天内的功能磁共振成像外,Porter等人之前的一项研究显示了个性化功能磁共振成像方法在更短的时间尺度内跟踪变化的潜力。在本研究中,作者在一个精确的fMRI数据集中,使用交叉验证的fcMRI和机器学习方法对不同的任务状态进行了分类。作者能够将不同人群之间的这些状态的差异进行分类,但在对同一个人的状态进行分类时,这些预测更成功(准确率提高了30%)。然后将这个模式复制到一个具有新任务的独立数据集中。这些结果强调,个性化的功能磁共振成像模型可以成为测量大脑状态变化的强大方法,检测在群体水平的方法中无法观察到的效果。
一组小型研究也使用了个性化的功能磁共振成像来跟踪精神病理学随时间的变化。虽然这些研究没有收集到足够的数据来归类为精确功能磁共振成像(即,它们基于每个参与者的< 10 min数据),但他们使用了fcMRI方法,提供了大脑网络的个性化估计。然而,这些方法的使用增加了脑网络连接测量和精神病理症状变化之间观察到的效应大小。在一项研究中,被诊断为首发精神分裂症的参与者在基线和接受抗精神病药物治疗8周后进行了扫描。结果显示,个性化fcMRI方法能够更好地预测精神分裂症的阳性症状(r(28)=0.57 v.s. r(28)=0.22)。在另一项研究中,测量了强迫症患者在住院设施治疗前后的fc磁共振成像的变化。虽然使用个性化和基于群体的分割测量的fcMRI可以显著预测自我报告的症状,但只有个性化分割可以显著预测治疗后的症状变化(r(39)=0.374 v.s. r(39)=0.177)。与组水平的方法相比,fcMRI的个性化估计的变化也被证明与重度抑郁症症状的变化相关性更强。这些研究共同提供了初步证据,表明使用个性化模型在跟踪变化方面优于群体水平分析精神病理学症状。
除了这些研究之外,有证据表明,精确的fMRI数据也可以增加在fcMRI和精神病理学之间观察到的效应量。在最近的一项研究中,Gordon等人使用了一种精确成像方法,在被诊断为创伤后应激障碍的个体样本中,每个参与者收集了大量的fcMRI数据。作者发现,自我报告的创伤后应激症状与来自群体水平功能图谱的功能磁共振成像之间存在显著关联。然而,当使用少量(10 min)的fMRI数据来计算每个个体的fcMRI测量时,大脑网络和症状严重程度之间的关系不再显著(r(24)=−0.47 v.s. r(24)=−0.22)。这表明,扩展的数据收集方法很可能会提高我们找到功能磁共振成像和精神病理学之间可靠联系的能力,即使使用了群体水平的方法。
本节中提供的证据表明,需要大量的fMRI数据来获得可靠的个体水平的fcMRI测量方法。此外,对功能磁共振成像进行可靠的估计,以准确跟踪大脑网络的稳定特征,并将这些与不同时间和状态的大脑网络连接的更微妙的变化分开,是必要的。初步证据还表明,个性化模型和精确的fMRI数据都提高了我们检测fcMRI和精神病理学之间关系的能力。总之,这表明,识别fcMRI和精神病理学之间的关系可以受益于基于fMRI数据集的扩展数据收集的个性化模型。
4.2 精神病理学基础的动态过程的个体差异与生物标志物研究相关
虽然本节到目前为止已经讨论了个性化模型对测量大脑网络随时间变化的效用,但之前的工作表明,这个问题也与量化精神病理学的症状有关。这是因为,尽管精神病理症状的严重程度可以在短时间内发生变化,但有证据表明,随着时间的推移,精神病理症状之间存在动态但可重复的模式。这些观察结果导致了许多以个体内部情感、认知和行为机制失调为特征的临床理论。然而,在过去的工作中,这些机制大多是使用群体水平的方法进行研究的。鉴于这些理论中提出的机制存在于个体的水平上,生物标志物研究更好地理解这些机制中个体差异存在的程度是很重要的。
一个假设精神病理学中存在动态机制的理论例子来自于神经质的研究,它被定义为高度负面情绪的普遍经验。先前的证据表明,神经质水平的升高和经历生活压力源是发生抑郁发作的风险因素。然而,这两种危险因素相互作用的程度尚不清楚,因为关于经历生活压力源后神经质对负面情绪水平的动态影响已有多种理论提出。在这些理论中,消极情绪被假设是通过(a)增加暴露或对压力源的反应性而升高,或(b)是消极情绪的紧张性升高。一项使用(大约)两年评估的纵向研究的证据表明,这些风险因素相互作用,因此生活压力对神经质升高的患者的抑郁风险有更大的影响。这些结果表明,神经质升高放大了压力生活事件对抑郁风险的影响,这与通常被称为应激放大假说的理论一致(见图3B)。这一假说假设,与神经质水平较低的人相比,在经历生活压力源后,负面情绪的增加明显更大。
与这些结果相反,最近的纵向研究使用年度评估Mineka 等人发现有显著的生活压力和神经质对未来抑郁症的风险,但这些影响之间的交互作用并不显著(事实上明显小于他们报告的主要影响)。因此,本研究的结果更符合负面影响稳定升高的理论(也称为静水海平面(神经质)-波峰(应力)模型(图3A)。该理论指出,神经质的升高与持续升高的负面情绪有关(无论痛苦的明确来源如何),神经质和生活压力源对负面情绪表现出主要的独立影响。因此,这两种理论对神经质高或低人群对生活压力的反应变化做出了不同的预测。
关于这些理论中哪一个是正确的,这些研究共同得出了不同的结论。这可能部分是因为这些假设是使用群体水平的研究设计来进行测试的,而不是在个体参与者中进行测试的。因此,这可能是由于每个样本中的一些个体具有与稳定升高的负性效应假说相一致的可重复的动态模式,而另一些个体则坚持应力放大假说。在这些条件下,群体水平的研究设计倾向于为两种抑郁症脆弱性模型的“平均”提供证据(图3C)。正如本例所示,如果不使用个性化模型,很难评估精神病理学的理论机制中是否存在个体差异。
图3. 一个假设的例子概述了当个体(C).的数据汇总时,个体水平上稳定升高的负面影响假说(A)和应激放大假说(B)是如何出现的面板A显示,消极情绪和生活压力源对升高的消极情绪的影响是可加性的,与稳定升高的消极情绪假说相一致。面板B说明了压力放大假说,其中负面情绪和生活压力源相互作用,产生升高的负面情绪。在这两种模型中,负面情绪的升高都增加了未来抑郁发作的后续风险。如果这两种假设在不同的个体中都是正确的,那么如果将数据集中在许多个体样本中,很可能会观察到类似于C组中提出的“平均”模型的东西。
最近使用个性化模型的工作支持了这样一种观点,即动态症状模式可能因个体而异。一个引人注目的例子来自上述Fisher的研究,该研究测量了10名被诊断为广泛性焦虑障碍的个体。除了第2.2节中描述的个体水平因子分析外,还对每个个体估计的潜在因素进行了动态因子建模。该方法估计了每个因素之间的同期和时间滞后关联,允许估计这些因素之间的时间点之间的协方差。然后,量化前一天的一个潜在因素与当天的其他因素共同变化的程度。这允许估计症状之间的关系如何随时间可重复地和动态地变化。
使用这种方法,观察到的焦虑症状之间的动态过程出现了明显的个体差异。例如,10名参与者中有一名表现出了一种动态的精神病理学模式,显示他们在前一天的回避水平与他们在第二天的一般痛苦和疲劳呈负相关。然而,其他三名参与者表现出了不同的模式,他们之前的担忧和回避水平预测了随后的担忧或广泛性焦虑障碍症状的增加。这些结果表明,个性化的精神病理学模型可以识别出可重复的症状动态模式,这些症状在个体之间是异质性的,甚至在同一疾病中。
额外的证据表明,由个性化的精神病理学模型捕获的可重复的动态模式可能与治疗相关。在一项研究重度抑郁症的纵向轨迹的研究中,每两周对255人的住院治疗过程中的症状进行了跟踪。使用针对时间序列数据设计的聚类分析,作者从常用的抑郁症状量表中聚类了17种抑郁症状。这项研究发现,对于抑郁症状共变异性较强的个体,治疗预后明显更好。换句话说,参与者的改善取决于他们的抑郁症状共同改善或恶化的程度,而不是不同的抑郁症状有不同的轨迹。
虽然本综述的重点是精神病理学的自我报告测量,但基于被动感知数据的个性化模型,如GPS、环境声音和手机使用情况的潜力也值得提及。例如,长期以来人们注意到GPS跟踪的个体运动模式是特殊的,但也包含可重复的模式。这些指标中的个体差异已被证明与人格测量相关,并预测了年轻人的酗酒。因此,这些被动感知指标也显示了测量与精神病理相关的行为的动态变化的希望。
总之,本节讨论了异质性的证据及其在精神病理学的动态过程理论中的意义。虽然这里只强调了一些研究,但其他的工作支持了这些动态过程中存在个体差异的观点。这些动态过程中个体间显著差异的可能性为群体水平的研究设计提出了一个问题,这些研究设计试图将精神病理学的多个模型相互检验,因为这些方法无法解释不同个体的症状与不同模型一致的可能性。鉴于不同的动态过程可能与不同的生物学相关,跨异质参与者的数据分组可能会阻碍精神病学中生物标志物的研究。由于个性化模型可以估计每个个体内部的这些不同模式,因此它们是解决这些问题的理想候选对象。
5. 通过结合个体化方法测量大脑和行为,生物标志物研究的未来方向
到目前为止,这篇综述已经讨论了先前生成个性化的精神病理学症状模型和用fcMRI测量的大脑网络的研究。第二节讨论了功能磁共振成像和精神病理学的个性化模型包含了个体水平上的功能信息,这些信息可能无法通过群体层次研究设计观察到的证据。第三节回顾了这些测量方法如何随时间变化的证据,有证据表明,精神病理学和大脑网络的个性化模型非常适合于测量稳定的、可重复的模式和更短暂的状态。然而,尽管在功能磁共振成像和精神病理学的个性化模型中存在这些共同的主题,但到目前为止,从这两个独立的领域还缺乏整合到统一的研究设计中。
为此,本节最后一节的目标是提供建议,说明如何将这两种方法统一为一个研究议程,并将精神病理学和功能磁共振成像的个性化模型纳入生物标志物研究中。本文提出了三种研究设计目的探讨精神病理学和fcMRI中稳定的性状样和短暂状态样变异来源之间的关系(图4)。在第一种设计中,这里被称为稳定特征设计(图4A),其目标是将大脑网络中稳定的、类似特征的方面与个体水平上类似的稳定的精神病理学模型联系起来。第二种设计,在这里被称为瞬态设计(图4B),旨在识别与个体精神症状的短暂变化同时发生的fcMRI的短暂变化。最后,第三种设计,这里称为干预设计(图4C),旨在测量干预后个性化fc磁共振成像和精神病理的变化。
图4. 使用图1和图3中前面讨论的例子,显示了本节中概述的所有三种研究设计的可视化描述。对于每一种设计,在(A)稳定特征、(B)瞬态或(C)干预研究设计中,估计了fcMRI和精神病理学的个性化估计的差异。图中每个部分的下方显示了每个研究设计的时间轴示例,显示了每个参与者的精确fcMRI(橙色线)和自我报告调查(绿色线)抽样的假设研究时间线。(A)在稳定性状设计中,比较了与稳定升高负情绪假说相似的个体(蓝色)与与应激放大假说相似的个体之间的性状个体差异。(B)在瞬态设计中,随着症状从负面情绪和生活压力源的组合(蓝色),随后增加负面情绪(红色),对同一个体内的个性化功能磁共振成像进行比较。(C)在干预设计中,比较了干预前和干预后的fcMRI和精神病理学的个性化测量(红色X)。在这种情况下,根据压力放大假设(蓝色),一个假设的干预的目标是破坏暴露于生活应激源后的负面情绪的升高。如图所示的大脑网络的颜色与图1中的图例相对应。
关于fcMRI(鉴于大量文献将精神病理与分布式大脑网络联系起来),这些设计也可以自然扩展到fMRI任务激活分析以及其他神经成像措施。因此,需要注意的是,图4中建议的研究设计并不是相互排斥的,它们的不同方面可以为不同的目的而组合起来。例如,瞬态设计可以用于测量大脑网络和精神病理学的稳定和瞬态方面,尽管稳定特征设计可能提供了一种更具时间和成本效益的方法来测量功能的稳定方面。这些设计的细节将在下面的章节中进一步详细阐述,以及使用个性化模型进行研究的一些一般方法考虑。
5.1 稳定性状研究设计
使用fcMRI和精神病理学的个性化模型来寻找生物标志物的一种方法是寻找大脑网络的稳定特征样测量和精神病理学之间的关系。这种类型的研究设计在这里被称为稳定性状研究设计(图4A)。正如先前的证据表明,功能磁共振成像的测量和自我报告的精神病理在至少几个月的过程中表现出高的时间稳定性,这表明这些测量在很大程度上反映了个体大脑功能和精神病理的稳定个体差异。本实验设计假设,促进和维持精神病理症状之间特殊关系的机制的稳定个体差异具有不同的潜在神经相关性,这些应该反映在fcMRI的稳定个体差异中。
在本设计中,将收集足够精确的fcMRI和精神病理学自我报告测量值(图4A),以可靠地区分这些测量值中稳定的性状样方差和个体内的其他方差来源。在图4A的例子中,将在研究过程中收集精确的fMRI测量值(跨多个阶段收集以可靠地测量fcMRI;见第3.1节)。还将收集大量的精神病理学症状数据,以为每个个体创建个性化的症状模型。鉴于该设计的重点是稳定的特征样特征,fc磁共振成像和精神病理学测量不需要是同时代的,假设这些测量的特征样成分应该随着时间显示出很少的变化。然而,获得功能磁共振成像和精神病理学的同步测量方法可能仍然是理想的,因为即使是来自这些领域的特征样测量方法也可能随着时间的推移而不完全稳定。
假设测试在这个例子中,个体可以分组的共性在个性化的精神病理学模型,和功能磁共振成像功能区分这些组可以识别如个性化大脑网络的大小和连接强度(注意相反的方法分组fcMRI共性也可以使用)。例如,fcMRI的个体差异可以在更符合稳定升高的负面情绪假说(图4A,左)和更接近应激放大假说的个体(图4A,右)的参与者之间进行比较。然后,可以评估这些组之间的大脑网络连接的显著差异。或者,可以使用连续的测量方法来进行假设检验,而不是明确地将个体进行分组。该研究设计在概念上与许多使用fcMRI的当代生物标志物研究极为相似,但不同之处在于,它包含了个性化大脑网络和精神病理学模型提供的个体水平信息。这种类型的研究可能有助于识别神经生物学支持的诊断类别,包括具有相似症状表现的个体的特定亚群。该研究设计的另一个可能应用是提供可用于风险计算器的信息,以确定个体最终出现特定疾病的可能性。
5.2 瞬态研究设计
另一项使用功能磁共振成像和精神病理学的个性化模型来识别生物标志物的研究设计是识别这些测量值随时间的波动之间的关系。这种类型的受试者内部纵向设计在这里表示为瞬态设计(图4B)。如第3.1节所述,虽然fcMRI网络基本稳定,但它们也会随着时间微妙变化。同样,精神病理学的个性化模型表现出稳定的动态过程和机制模式,维持所观察到的精神病理学症状。然而,这些个性化模型的一个关键特征是,每个症状的报告值在不同的测量时间点上都有所不同。
为了捕捉短暂的变异性,这种类型的研究将利用精确功能磁共振成像与精神病理症状配对的重复纵向测量(例如,配对功能磁共振成像扫描和许多时间点的精神病理测量,如图4B底部所示)。通过收集足够的数据进行精确的fcMRI测量,从而在每个时间点获得可靠的测量,连通性的瞬态变化可以与稳定的特征方面分开量化。使用瞬态设计,可以测量fcMRI的个性化估计是否随着时间内精神病理的动态变化而系统地变化。因此,可以识别出在一种精神病理学模式中存在的不同“状态”的神经关联(如图3)。
该实验设计非常适合于测量与个性化精神病理学模型中发现的不同过程和机制相关的个性化fcMRI模型的变化。再次使用神经质、生活压力源和抑郁的例子,可以生成fcMRI的个性化模型,在这些时间段内,生活压力源是否发生(图4B,左),其中负面影响预计随后会增加(图4B,右)。与负面情绪的紧张性升高相关的fcMRI的短暂变化可以与经历生活应激源后不久测量的fcMRI进行比较。通过这种方式,在给定的个性化精神病理学模型的不同“状态”中持续发生的fcMRI的短暂变化就可以被量化。
本研究设计的一个重要假设是,精神病理学中的这些动态过程在时间上有足够长的时间间隔,因此可以获得单独的fcMRI测量值。这一假设的一些证据是存在的,因为担忧的增加已被证明会在担忧升高后的第二天导致负面影响的增加或减少。有证据表明,个性化病理模型在采样间隔(24小时)内显示出有意义的个体差异,这表明收集足够的fcMRI数据与症状的短暂变化共同变化是可行的。这种类型的研究设计有许多可能的应用,如识别与精神症状的动态变化相关的大脑网络,以帮助识别基于症状严重程度的临床界限,或识别神经相关,表明当一个人可能经历临床显著的精神病理。更好地理解功能磁共振成像中这些短暂的变化发生在大脑中的位置,有可能为精神病理学症状的神经生物学基础提供见解。
5.3 干预研究设计
第三项研究设计旨在量化功能磁共振成像和精神病理的个性化模型元素如何在干预后发生变化。在实践中,本研究设计与稳定特征设计有许多相似之处,但分别估计了干预前后功能磁共振成像和精神病理的个性化模型。在本设计的治疗前间隔时间内,MRI和精神病理学的个性化模型将被估计作为基线。然后,在干预后(和/或干预期间)(图4C,右),可以再次量化fcMRI和精神病理学的个性化模型的变化。一些可以用于本研究设计的干预措施的例子是药物治疗,神经刺激,或心理治疗。
一种测试干预反应变化的方法可能是根据基线时的功能磁共振成像或精神病理学测量方法对个体进行分组,或者根据个体对干预反应的变化将个体分开(例如,有反应者与无反应者)。这种设计可以用来衡量一种治疗是否、程度或需要多长时间才能显示疗效(以及在什么时候开始趋于稳定)。这项研究设计不仅局限于一种治疗形式的干预,而且可以适用于更短暂的干预,如认知任务,这些已被证明可以显著改变功能磁共振成像的个体。
再次回到我们关于神经质、生活压力源和抑郁发作的例子,在本研究设计中,可以实施一种治疗方法,假设其减少生活压力源和随后增加的负面情绪之间的联系(图4C,右)。另外,干预可以针对一个给定的大脑网络(例如,默认模式网络)内的连接,并测量在经历生活压力源后,连接强度的变化与负面影响的变化。在这两种情况下,fcMRI个性化模型的变化将与精神病理学个性化模型的变化进行比较。此外,在对特定治疗有强烈反应的参与者和那些表现出较弱反应的参与者之间可以发现共性,允许开发关于谁可能特别受益的新假设。因此,这种设计可以告知治疗如何影响大脑网络和精神病理学之间的关系,这些信息可以用于简化针对个人的干预措施。
5.4 整合功能磁共振成像和精神病理学的个性化模型的方法论问题
虽然从这些研究设计中获得的见解有可能提高我们识别生物标记物的能力,但有几个方法学问题值得提及。一种是不清楚需要多少参与者来识别参与者之间的共性,并检查样本中观察到的影响的个体间差异。在最初的工作中,即使样本小到10名参与者,在磁共振成像和精神病理学中都发现了受试者之间的显著变异性。虽然这些较小的样本足以确定这些领域中个体变异的存在和特征,但需要更大的、更多样化的样本来量化它们在总体人群中的代表性。
另一个可能的方法上的担忧是,参与者数量少(每人需要收集大量数据),可能缺乏统计能力来获得显著的结果。然而,对于关注于个体效应的研究设计(例如,瞬态和干预研究设计),这并不那么重要,因为在这些研究设计中,统计能力主要由受试者内数据点的数量决定,而不是参与者的数量。即使在情况不是这样的研究中,统计能力与总体样本量相关(例如,稳定特征设计),使用高度可靠的fcMRI和精神病理学的主题内测量的研究的统计能力更大。因此,个性化模型的固有好处应该会改善这些研究设计中有关统计能力的问题。为了更好地概述个性化建模方法的统计特性,还需要在这个领域进行更多的工作。
样本量较小的一个相关问题是,目前尚不清楚这些研究的结果会在多大程度上推广到给定的样本之外。为了缓解这一问题,基于这些研究设计的研究可以采用逐步抽样的重测设计,即小组参与者,并试图将这些结果推广到其他群体。例如,参与者可以在波中被招募,在早期波中获得的结果可以在后期波中得到证实。在这些研究设计中,许多样本的受试者内效应的可重复性程度可以作为一个有用的指标,说明它们从样本中概括的程度。例如,如果大量的样本产生具有相似效应大小和均匀分布的结果,那么与样本之间存在实质性的异质性相比,结果更有可能推广到其他参与者。在后一种情况下,需要更大规模的复制来确认给定效果的普遍性。由于收集功能磁共振成像数据的费用,在某些情况下,如果试图检验一个先验假设(例如,对比两个理论模型),首先在更大的参与者群体中生成个性化的精神病理症状模型可能更可行。随后,可以根据个体个性化症状模型的相关性选择个体子集用于fMRI数据收集。
生物标志物研究中的通用性问题也与获得预测效度的无偏估计的问题密切相关。由于个性化模型比典型研究中每个参与者包含的数据量更多,因此这些研究使用最佳实践从其模型中生成准确的预测是至关重要的。这包括避免模型对数据进行过拟合,以及在适当时使用最佳实践进行交叉验证。尽管存在这些障碍,从精神病理学个性化模型中获得的大量数据可能符合生成准确预测行为的模型的目标。例如,与跨学科模型相比,特定于个人的机器学习模型可以从功能连接中更好地预测任务状态。
虽然个性化模型在生物标志物研究中的前景显而易见的,但另一个相关问题是该研究如何在临床环境中提供直接的好处。在大多数情况下,它可能是不可行的要求个人寻求精神治疗完成广泛的数据收集在几天到几周或坐在核磁共振扫描仪几个小时在多个会议。一个关键的洞察这个目标是,尽管个性化的精神病学模型提供过多的信息个人功能不能测量使用简短,横断面自我报告测量,这些措施的平均分数在个性化模型显示良好的对应这些简短的自我报告措施。
例如,如果在默认的网络连通性和在生活压力源,这将表明这种增加的连接性是增加压力源反应性的生物标志物。然后,前瞻性样本可以用来复制这两种措施之间的关系,并证明针对默认网络连接的干预措施的潜力。基于这种可复制的关系,可以开发出一种简短的自我报告测量方法,可靠地测量对生活压力源的反应性,并与通过个性化模型获得的相同测量方法的值高度相关。然后,在临床环境中,这种简短的自我报告测量方法的得分可以用来确定一种旨在通过针对默认的网络连接来减少对生活压力源的反应性的干预措施的成功可能性。因此,这里概述的研究框架的结果有可能很容易地转化为临床实践,并对寻求治疗的个人带来现实的负担。然而,需要注意的是,生物标志物的信度和有效性并不是其临床应用的唯一障碍。生物标记物面临着其他实际限制,如获取它们的成本和管理和解释它们所需的专业知识,这也是它们广泛使用的障碍。
尽管个性化模型对转化神经科学有许多潜在的好处,但它们需要从目前使用的识别精神病理学神经关联的主要研究设计中进行很大的范式转变。许多研究小组的成立并不是为了收集和分析个人参与者的大量数据,人们自然会担心投入大量的时间和资金,似乎不确定的回报。然而,尽管存在这些担忧,从每个人那里收集大量数据的潜在好处是显而易见的。有了现代数据共享能力,研究人员将有可能使用不同的研究设计检查来自样本个性化模型的数据,从而开发一致的数据收集和分析策略。然后,在个体研究中估计的个性化模型可以从许多不同的研究小组收集的数据中聚合起来,从而告知精神病理学和大脑功能的不同机制在整个人群中是多么普遍。这将使研究人员能够更好地理解这项研究的结果对临床目的的普遍性,并估计可能从针对与精神病理学相关的特定过程的新治疗中获益的人数。
5.5 在生物标志物研究中使用fcMRI和精神病理学的个性化模型的局限性和挑战
虽然功能磁共振成像和精神病理学的个性化模型的潜力很有希望,但尚未建立出估计这些模型的最佳实践。有几个突出的方法问题和局限性值得在这里进一步讨论。这些问题必须得到解决,以达到它们在生物标志物研究中的充分前景。
在磁共振成像研究中,一个问题是扫描仪内的头部运动系统地使大脑网络连接估计产生偏差,参与者在扫描仪中移动的数量与认知和行为测量显著相关。因此,没有使用最佳实践来处理头部运动伪影的研究可能获得fcMRI和行为之间关系的有偏倚估计。除了头动,大脑网络连接的估计可以系统地受到是否从数据中删除整个大脑的平均信号(全局信号)的影响、处理管道的选择,以及使用fcMRI数据定义大脑网络的最佳分辨率。虽然这些方法学问题给生成fcMRI的个性化模型带来了挑战,但许多研究已经证明了这种方法在个体差异研究中的潜力。未来的工作将需要确定处理MRI数据和解释伪影的最佳实践,这一努力已经在进行中。
与功能磁共振成像研究一样,在使用个性化的精神病理学模型进行生物标志物研究方面也有一些悬而未决的问题。不同研究小组定义个性化模型的策略存在广泛差异,这些方法上的差异会显著影响结果的解释。目前还不清楚哪个时间尺度适合从个体获得这些测量,纵向采样过程中每个时间点之间的时间可能会对结果产生重要影响。与此相关的是,除了上面提到的方法外,还使用了各种生成个性化模型的方法。例如,统一结构方程建模、向量自回归模型和组迭代多模型估计也显示出了建模个体精神症状之间的动态关系的希望。然而,在这一点上,这些模型中哪一个在不同的情况下表现得更好仍然是一个悬而未决的问题。
一个相关的问题是,相对于基于组水平数据的模型,如何解释这些模型的特殊特征。虽然这里提出的证据表明,在个性化模型中经常观察到特殊特征,但个体数据模型与群体水平上定义的模型的不同程度通常没有得到系统的评估。例如,通过评估两个模型之间的不变性程度,应该可以测试使用一组个体定义的模型与从任何一个个体获得的数据的匹配程。这对于实证检验个性化模型提供了通过群体水平分析无法获得的信息很重要,从而验证个体的精神病理症状的结构与群体定义的结构显著不同。
此外,同样重要的是要测试更广泛的精神病理因素(例如,在许多群体定义的模型中报告的内化和外化因素)是否可以在个体中发现,因为这也将提供关于个体的精神病理症状与群体水平上定义的症状如何相似的信息。这将需要检查从个性化模型中获得的因素之间的相关性,以看看是否在个体中发现了这些更广泛的范围因素的证据。除了提供一个更严格的测试,一个人的精神病理症状如何与组中获得的症状相关,测量一个人与群体水平模型的差异也可能与临床效用相关。例如,一个人与群体定义的模型之间的不同数量可能可以预测典型的一线治疗的有效程度。因此,更好地理解一个人是如何与群体进行精确的比较,将是评估精神病理学的个性化模型的效用的有价值的信息。
同样值得注意的是,在这里讨论的许多研究中,所报道的精神病理学症状测量的可靠性和稳定性没有被报道。这些测量的可靠性对于它们的解释至关重要,正如上面所讨论的,它们在时间上的稳定程度对它们与精神病理学的相关性具有重要意义。因此,关于这些测量的时间稳定性的信息对于理解它们在多大程度上代表精神病理学中稳定特征或短暂状态的方面至关重要。尽管存在这些突出的方法问题,精神病理学的个性化模型提供了一个独特的机会来识别维持精神病理学的人体内机制,而这些模型提供的信息可能与生物标志物研究相关。
虽然这里讨论的个性化模型的方法学问题是生物标志物研究持续进展的障碍,但需要注意的是,解决这些问题的进展已经开始。研究人员在这两种功能磁共振成像中都使用了个性化的模型和精神病理学正在积极努力更好地理解这些问题,并改进这些领域的方法。因此,尽管在任何相对年轻的研究领域中仍然存在突出的方法问题,但个性化模型对提高我们对生物标志物的理解的潜力仍然很有希望。
6. 结论
这篇综述概述了生成个性化的精神病理学和功能磁共振成像模型的基本原理,以识别精神病学中的生物标志物。这种策略的优点是,个性化模型可以在个体层面上捕获大脑网络和精神病理学的可靠个体差异,而这是无法从这些测量的群体层面估计中获得的。来自这些模型的证据表明,虽然个体之间存在共性,但个体可靠地不同于群体水平的模式。此外,这些差异可能对更好地理解大脑和行为之间的关系很重要。这里讨论的证据表明,在群体水平的大脑和人类行为的测量中缺乏普遍性,应该鼓励重新评估生物标志物研究的适当研究设计。具体来说,它对以从每个个体中抽样更多数据为代价抽样更多参与者的现状提出了质疑。根据RDoC倡议的目标,更加关注个体层面的过程,为识别与精神病理学的特定机制相关的生物标志物提供了机会。
为了支持这一目标,我们通过提出了几个可行的研究设计来结束这篇综述,这些研究设计有可能识别维持个体精神病理的过程和机制的生物标记物。我们还讨论了为使这种新方法发挥其潜力所需要解决的悬而未决的方法问题和局限性。虽然这些不确定性可能会导致任何其他新兴研究领域的成长烦恼,但这里提出的证据表明,在生物标志物研究中增加关注个性化模型的潜在好处远远超过了陷阱。
虽然目前只是一个假设的框架,但我们认为本综述中提出的fcMRI和精神病理学的结合对于在精神病学中寻找生物标志物至关重要。虽然有一些突出的方法问题必须得到解决,但我们认为,这种方法的好处远远超过了当代在精神病学中识别生物标志物的方法。我们希望这里提出的想法有助于重新考虑生物标志物研究的最佳研究设计,并且使用这些个性化方法的研究可以帮助我们在未来几年理解精神病理学的神经相关性。
参考文献:Insights from personalized models of brain and behavior for identifying biomarkers in psychiatry.