自闭症是一种异质性的神经发育疾病,基于功能磁共振成像的研究有助于推进我们对其对大脑网络活动影响的理解。我们回顾了使用功能连接和症状的测量的预测建模如何帮助揭示对这种情况的关键见解。我们讨论了不同的预测框架如何进一步加深我们对复杂自闭症症状学基础的基于大脑特征的理解,并考虑预测模型如何在临床环境中使用。在整个研究过程中,我们强调了研究解释的一些方面,如数据衰减和抽样偏差,这些都需要在这种情况下进行考虑。最后,我们提出了自闭症预测建模令人兴奋的未来方向。
自闭症谱系障碍(以下简称自闭症)是一种神经发育障碍,其特征是社会交流和互动困难,行为受限和重复,对感觉信息的非典型反应。自闭症特征治疗,特别是在医疗干预方面的经验有限。通过确定个体化干预的目标,提高我们对这种疾病的脑基础特征的理解的方法最终可以指导临床研究和实践。
功能性磁共振成像(fMRI)连通性分析已经产生了定位支持特定行为的脑回路的工具。这些方法可以用来推断通过预测模型验证的个体层面的脑行为关系。基于预测的方法提供了一个统计上严格的框架(通过使用单独的数据进行模型训练和测试)来研究个体差异,特别是在神经发育疾病。在这里,我们断言模型在自闭症中有两个广泛的实用领域:1)加深我们对功能连接如何结合从而产生复杂自闭症症状学的理解(以下为生物学见解);2)潜在地帮助诊断、预测、干预计划和干预反应的监测(以下为临床应用)(图1A)。
图1 预测建模在自闭症中的应用。
考虑到这两个方面,我们回顾了自闭症预测建模文献,重点关注使用MRI功能连接数据的研究。与自闭症的终生性质一致,我们考虑了参与者年龄范围(6个月到65岁)的广泛研究。在详细介绍了自闭症特异性研究设计的考虑因素之后,我们讨论了三个预测建模框架:病例对照分类、维度预测和子类型应用(图1B)。在每个部分,我们强调基于大脑的见解,并确定我们期望预测模型产生临床效用的领域。因为基于大脑的见解是临床有用模型的基础(反之亦然),我们将它们的讨论编织在整个文本中,以强调它们的相互依赖性。这篇综述的目的是强调感兴趣的关键论文,并讨论可以使自闭症预测模型更有用的概念性考虑因素。我们的目标不是对自闭症预测研究中的机器学习方法/算法进行详尽的、系统的综述。
1. 预测建模的自闭症特异性考虑
1.1 预测模型提供生物学见解和潜在的临床用途
为了本综述的目的,预测建模包含了使用统计将MRI功能连接度量与表型度量(诊断状态/症状)关联起来的方法。这些方法将数据集分离为训练和测试样本,然后应用交叉验证或使用外部数据来测试模型。在这里,我们强调通过预测建模选择的功能特征(连接和网络)和它们提供的潜在生物学见解/临床相关性。例如,考虑一个模型,它暗示额顶叶区域的连接对社会注意力很重要。这样的模型通过定位电路产生了对复杂表型的生物学见解。通过预测哪些个体最有可能对行为干预产生反应,该模型可能在未来显示出临床效用。
1.2 平衡大样本量,关注数据衰减和站点效应
对自闭症参与者和神经典型参与者的预测建模研究表明,需要大样本才能获得可复制的结果。在自闭症领域,使用大型数据集通常意味着使用来自自闭症脑成像数据交换(ABIDE)和/或欧洲自闭症干预开发新药多中心研究(EU-AIMS)的数据。这些样本的一个问题是数据衰减,并与敏感性和特异性有关(病例对照分类研究的相关性概念;敏感度是一种算法对自闭症患者进行正确分类的能力;专一性是一种算法,它能正确地将没有这种疾病的典型神经个体分类。数据衰减意味着随着时间的推移,样本揭示新的统计上显著关系(如敏感性/特异性)的能力随着在样本中执行的统计检验数量的增加而下降。对数据衰减的担忧并非自闭症研究独有;使用阿尔茨海默氏症神经成像计划(ADNI)数据集的人也发现了类似的问题。
此外,ABIDE和EU-AIMS包括来自多个站点的数据。必须注意确保现场效应不会混淆结果;ComBat是研究人员用来最小化现场影响的一种方法。为了帮助进一步减轻对数据衰减和位点效应的担忧,可以使用其他样本来进一步验证预测模型,就像对其他表型所做的那样。使用多个数据集来确保结果在样本间保持不变是增加结果普遍性的一种方法。我们描述这些问题是为了提高人们的意识;我们强烈提倡公开共享数据集。
1.3 混淆,扫描环境的可容忍性,和预测建模的结果
混杂,或与模型中的自变量和因变量都相关的变量,可以驱动虚假的统计关系,并导致错误的结论。在测量功能连通性方面,扫描仪头部运动是一个臭名昭著的混乱现象,也是自闭症领域的一个关注。执行全局信号回归可以减少运动伪影,并在自闭症患者和神经正常个体中加强脑-行为关系。实现全局信号回归并非没有争议,包括全局信号回归如何改变功能相关结构和影响组间比较。
除非采用一致的方法来消除头部运动的影响,否则在模型构建中经常排除高运动数据的个体。这种做法影响了预测建模研究中的参与者。与此相关,能够接受功能磁共振成像扫描并产生低运动数据的自闭症患者往往有较少的语言/认知障碍和较高的智商。当考虑在临床环境中使用预测建模的可行性时,必须记住这些事实。为了使满足数据质量标准的自闭症患者多样化,成像协议的长度通常通过缩短功能扫描(5分钟)和取消任务扫描来最小化。代价是获得的数据范围有限。更少、更短的扫描导致更不可靠的功能连接组,静息状态数据往往产生较差的预测性能(在神经典型个体中)。混淆的确切解决方案取决于分析目标,但我们建议读者参考英国生物银行的混淆检查(以及解决它们的方法)。为了提高功能性连接体的可靠性,我们建议收集更多的扫描数据(包括任务和休息数据)和/或使用提高扫描数据质量的方法[Framewise集成实时MRI监测,模拟扫描协议,Inscapes]。
1.4 共病和表型重叠
自闭症患者有很高的并发率,包括注意力缺陷/多动障碍(ADHD)、焦虑障碍和智力障碍。共病可能给研究人员带来挑战,包括如何对不同的诊断进行共变。链接分析方法(即,维度和子类型方法)是一种解决方案。例如,有焦虑症状和没有焦虑症状的个体可以被分组为先验亚型,并且可以生成单独的维度模型来预测每一组的自闭症症状。允许参与者在不同程度上表达子类型特征的方法(多维子类型)在解析异构性方面也显示出了成功。
1.5 自闭症的性别失衡和预测模型中的性别特异性效应
性别效应在自闭症的预测建模中起着重要作用。据估计,在诊断中男女比例为3:1,自闭症的神经生物学也存在性别差异。女性和男性往往表现出不同的症状,往往导致女性漏诊。此外,预测神经典型个体的流体智力的模型在为每个性别分别生成时显示出更高的准确性,模型的功能特征是性别特异性的。性别特异性与使用神经典型个体的连通性数据预测性别的高度准确性一致。因此,研究人员应该在分析中纳入同等数量的男性和女性(在可行的情况下)和/或建立性别特异性模型。我们接下来强调所有这些因素如何影响自闭症预测建模的生物学和临床效用,我们回顾了三种不同的方法:病例对照分类、维度表型预测和子类型特异性预测。
2. 病例对照分类:侧重诊断的病例
病例对照分类研究构成了大多数自闭症预测文献(表1)。这些研究的优势在于其明确的性质:参与者被正确分类或未被正确分类。与维度和子类型预测研究相比,该研究的另一个优点是数量大,可以观察到广泛的趋势。下面,我们从发育的角度,从婴儿期到成年期(65岁以上),重点介绍了其中一些研究的生物学和临床用途。
3. 自闭症分类中涉及的基于大脑的特征在整个生命周期中是不同的
自闭症是一种终身疾病,其症状会在个体的一生中发生变化。发育变化反映在神经生物学的相关因素中,将自闭症个体与正常的参与者区分开来。例如,使用高斯核支持向量机和来自ABIDE的静息状态数据,Kazeminejad和Sotero已经表明,5至15岁儿童自闭症状态的最具辨别性的功能特征(涉及顶叶和腹侧前额叶皮质的连接),与15至30岁儿童的最具辨别性的功能特征(涉及背外侧前额叶皮质和颞叶皮质的连接更多)不同。在所有研究中,发育影响的总体主题:在生命周期的不同阶段,区分自闭症病例和正常神经参与者的功能网络组织似乎是不同的。在使用t1加权结构MRI数据的病例对照研究中,跨寿命的差异也存在,并与大脑成熟的动态性质相一致。
从这些证据中,我们得出两个结论。首先,不能在不同年龄组间推广的预测模型不应被视为模型失败。自闭症病例控制分类的年龄特异性模型可能是最大化模型效用的必要条件。这一观察结果与对儿童(11 - 18岁)进行的纵向研究一致,表明自闭症患者和非自闭症患者的功能网络变化速度不同。其次,鉴于证据越来越多,我们可以进行一些总体观察,并设计新的假设进行检验。例如,皮质区域的成熟轨迹倾向于遵循一个分级的感觉-联想轴。单峰感觉区在儿童期成熟,异峰联想区在青春期和青年期成熟。在自闭症中观察到这个层次结构的破坏,使得在分类的背景下考虑这个轴变得有趣。也许沿着这条功能轴的发育偏差可以用来更准确地区分自闭症患者和非自闭症患者?未来,研究人员可以在大型数据集中调查这一假设,同时牢记自闭症特有的预测建模问题 (表1)。
表1
4. 临床用途:促进早期诊断
临床相关研究的一个主要推动方向是在发展的早期阶段使用客观的生物标记来识别自闭症患者(图2),此时支持服务是最有效的。使用功能连接数据对病例控制状态的准确预测已在5岁以下的个体中得到证实。在一项更小年龄的研究中,Emerson等人使用了6个月大的婴儿睡觉时成像的功能连接数据,并表明支持向量机可以用来预测24个月大时的自闭症状态(图3A)。驱动正确分类的网络模型是复杂的(图3B),包括分布在整个大脑的短期和长期连接,其中许多连接聚集在顶叶皮层。成功模型的神经解剖学复杂性是我们将在这篇综述中注意到的主题。
图2 自闭症干预的窗口
图3 使用婴儿脑功能连通性的测量,病例对照预测是可能的。
自闭症诊断可以在年轻时预测的证据是有希望的,并为更早的生命成像奠定了基础。来自基因研究的发现表明,自闭症特异性转录通路的变化可能在妊娠期很明显。鉴于胎儿成像技术的出现,未来的预测模型可能会被生成,以评估出生前自闭症的可能性,从而使支持服务在出生时可用。
5. 量纲预测:复杂症候的解释
包括自闭症在内的许多精神疾病的症状是连续存在的,而构成适应性行为与发散性行为之间的界限往往不明确。从生物学的角度来看,维度方法可以用来描述特定行为领域的功能,并识别大脑连接的潜在模式。然后,在干预后可对相关的功能回路进行临床监测。尽管有这些优势,但只有少数维度预测研究(表2)。下面,我们重点介绍两个领域的工作:症状的预测和对适应功能重要的认知表型的预测。
5.1 预测自闭症症状
Plitt等人进行了第一批展示维度症状预测的工作之一。在一个青少年和年轻人的样本中,作者使用来自先验网络(默认模式[DMN],突出性和额顶叶网络)的静息状态连接数据来预测(使用岭回归)3年后社会行为的变化。这个早期的报告令人兴奋,因为预测方法可以用来询问与复杂症状相关的功能联系。从那以后的工作中,我们使用了更多来自ABIDE的样本,来搜索与症状相关的全脑范围。例如,使用静息状态数据和基于连接体的预测建模,Lake等人生成了预测社会反应量表(SRS)得分的网络模型,以及预测自闭症诊断观察计划得分的独立模型(图4A, B)。虽然两个模型有一些共同的区域(小脑和皮层下区域,这些区域越来越被认为在认知和社会过程中很重要),但它们在很大程度上是不同的。检测到不同的功能回路的事实是令人鼓舞的:尽管这两种量表都测量社交能力,SRS和自闭症诊断观察量表的得分只在一定程度上相关,认为大脑和表现型之间潜在的微妙关系可以通过预测方法检测到。
图4 自闭症症状的维度预测
一旦建立,模型可以应用到不同的数据集,以测试普遍性,并确定不同的群体或表型是否共享神经生物学相关。例如,Lake等人将构建的用于预测自闭症个体SRS评分的基于连接体的预测建模网络(在ABIDE中生成)应用到一个独立的ADHD儿童样本(ADHD-200),并发现该模型预测了注意力不集中的症状(图4C)。这是值得注意的,因为自闭症和多动症的高并发性,因为模型中存在的大脑区域(小脑、皮层下区域和DMN),这些区域被认为对内部和外部注意的中介方面很重要。DMN也被发现在心理理论和社会推理中起着重要作用,这些过程在自闭症中通常是非典型的。通过两个网络模型的组合,一个用于预测交流,另一个用于预测社会互动能力,DMN也成为预测自闭症患者社会情感的关键。这些结果表明,尽管自闭症的症状很复杂,但在各种研究中找到神经生物学的共性是有可能的。
5.2 预测与适应性功能相关的表型
一个临床兴趣的途径是生成适应性功能的维度预测模型。为此,Rohr等人利用来自ABIDE的静息状态数据和基于连接体的预测建模,生成了预测自适应功能的一个组成部分的网络模型,即抵抗不适当行为冲动的能力。他们的行为抑制模型包括分布式的全脑功能特征,大部分在默认模式、躯体运动、视觉和小脑区域内或之间,与其他工作一致。这些发现指出了识别相关标记的可行性,可以跟踪测量行为干预后的改善。监测对干预反应的适应性功能的概念与预测未来的个体结果是密切相关的。Plitt等人的工作表明,这对自闭症患者来说是可能的,因为在成像后3年,可以(显著地)预测整体适应功能的变化。使用结构和功能MRI数据,规范建模方法已被证明在解开自闭症脑-行为关系的异质性方面是有用的;未来的工作可以应用这些模型来产生纵向表型预测。未来的研究还可以采用多维的方法来预测不同表型的组合,以及结合功能连接动力学的测量。
6. 子类型:通过寻找共性来简化复杂性
人们对确定自闭症亚型很感兴趣。这项工作旨在识别同质集群,以询问每个子组的生物学基础,为潜在干预提供更具体的信息。多种模式的结果支持自闭症中存在不同的聚类,包括结构MRI、脑电图、眼球跟踪和症状级测量。
6.1 连接体子类型的初步研究
基于聚类功能连接组的分型方法表明至少有两到三种自闭症亚型 (表3)。与维度模型识别的分布式大脑特征一致,分型方法表明不存在区分亚型的脑聚焦区域;基于大脑的区分子群体的特征是复杂的和空间分布的。然而,DMN和额顶神经网络(涉及维度模型)似乎最一致地参与了区分子类型。到目前为止,大多数的研究都是在遵规律性研究中进行的,而且往往以男性为中心。未来的工作应该评估不同数据集中的子类型的可靠性/可泛化性,包括更多的女性参与者,并使用休息和任务数据的组合。虽然大多数研究都专注于识别非重叠的子类型,但复杂的分析方法允许参与者在不同程度上表达不同的子类型,维度子类型开始被报道,这是热情的原因。
在确定了基于连接体的子类型之后,通常通过确定子组之间是否有其他度量(通常是症状信息)不同来验证它们。例如,Easson等人将k-means聚类应用于来自stand的静息状态功能连通性矩阵,并观察到两种不同的亚型(图5)。亚型由自闭症患者和非自闭症患者的混合组成。两种亚型在连通性上都有很大的差异。第一种亚型的显著特征是DMN与扣带-盖、躯体运动和视觉网络之间更强的连接。第二个子类型表现出更强的网络内连通性。此外,每种亚型在脑-行为关系上表现出不同。也就是说,每个亚型中独特的连通性特征分别预测了SRS和自闭症诊断观察量表得分。
图5 自闭症中的连接体亚型
6.2 脑行为预测模型的子类型研究
Easson等人确定的子类型显示出明显的大脑-行为关系,这一事实暗示了子类型大脑-行为预测模型的可能性。至关重要的是,这些亚型不仅基于大脑或表现型,还基于它们之间的关系,这使得它们与假设单个大脑表现型预测模型在样本中足够的工作不同。基于模型的子类型所揭示的分组可能有助于发现跨越诊断和人口统计学界限的个体集群。除了数据驱动的方法之外,假设驱动的基于模型的子类型也可能被证明是有用的,无论是基于症状概况还是其他测量成本较低的变量,如生理性别。总的来说,通过基于模型的子类型得到的基于大脑的特征将有助于深入了解自闭症的生物学基础。不同亚型的表型和人口统计学特征可能有助于对个体进行分诊,以便更好地护理管理。
7. 限制
有人对功能连接的可靠性表示关注。有研究表明,如果每个参与者都有足够的数据(每次扫描15分钟,可以对连接进行更可靠的估计),自闭症患者和神经正常患者之间的连接组会变得非常相似。这里报道的大多数研究只包括5分钟的扫描。可以进行更多的工作来确定增加数据量如何影响预测模型的准确性和可靠性。除了可靠性,功能连接的精确生物学性质仍然难以捉摸,这是预测建模研究必须承认的一个问题。病例对照研究的一个问题是将个体归为单一类别。自闭症患者有独特的症状特征和复杂的神经生物学相关症状。分类诊断使得很难确定一个表现型的具体方面是如何由潜在的脑回路支持的。此外,预测诊断在临床上是不够的;需要更多个人层面的信息来优化护理。人们已经对精神病学中的维度研究提出了担忧。例如,自闭症患者的严重沟通障碍可能是不同的神经生物学过程的结果而不是神经正常个体的支持沟通能力的过程;假设所有个体都可以被定位在一个给定表型的单一维度上,这可能是不正确的。某些维度指标(SRS)依赖于家长/自我报告测量;这些测量可能与感兴趣的症状或行为构想关系不大。维度方法可能无法用于建模所有脑表型关系,由于维度的诅咒,计算约束可能会限制维度方法的实用性。一些精神疾病的子类型已被证明很难在数据集之间复制,最近的一项研究报告无法定义自闭症的可靠子组。继续测试自闭症亚型的可重复性和可泛化性将是至关重要的。此外,对亚型的解释可能因未测量的、样本相关的协变量而复杂化。收集精确和包容性的人口/临床数据可用于纠正混淆,尽管隐藏的混淆可能持续存在。
8. 未来的方向和结论
我们已经回顾了预测建模框架如何提供洞察自闭症的神经生物学相关,以及潜在的临床效用。目前,病例对照分类研究包含了大多数文献,允许观察发展趋势。由于自闭症个体的异质性,需要更多的维度和分型预测研究。所有三种预测框架都可能受到这里讨论的自闭症特定建模考虑因素的影响。分类方法也许有一天能够使用客观的生物学数据进行早期诊断(甚至可能是在子宫内)。同时,维度和子类型研究可以加深我们对自闭症背后基于大脑的特征的理解,并通过基于图像的预测和干预反应监测发现改善管理的方法。
与自闭症症状的复杂性一致,基于大脑的预测模型是复杂的,揭示了支持特定行为的大规模网络。为了帮助解释和翻译,继续收集大型数据集是必不可少的。理想情况下,数据集应该是广泛的(大量不同的自闭症患者和非自闭症患者)和深入的(包括许多数据模式)。通过广泛而深入的方法获得的生物学见解的一个例子是确定特定的遗传特征是否构成了不同的连接表型,将基因、复杂的大脑活动模式和自闭症的行为表型联系起来的出色工作开始出现。深度、多模态聚焦可能提供fMRI和功能性近红外光谱或脑电图共同的标记,提供可用于临床的补充信息(而且比fMRI更便宜,一些人更能忍受)。对相同的参与者进行多次成像的密集扫描方法已被证明对神经正常的成年人有用。
结合创新的任务范式,如看电影,密集扫描可以在自然的社会环境中提供大量个人层面的数据。这样的方法可以帮助自闭症研究人员更好地分析参与者特定的轨迹。理想情况下,密集扫描计划将包括许多个体,以最大限度地检测个体差异(更多关于自闭症的密集扫描见附录)。我们并不认为前进的道路是容易的。尽管人们对fMRI的期望很高,但到目前为止,fMRI在很大程度上未能使自闭症患者受益。除了产生可靠的功能磁共振成像结果的困难之外,还有许多点的发现可能无法转化。研究和临床重点并不总是一致的,因此在研究人员、临床医生、自闭症患者和他们的护理人员之间保持开放的渠道是至关重要的。展望未来,我们设想预测建模方法将继续帮助探索理解自闭症的复杂神经生物学。
参考文献:Functional Connectome–Based Predictive Modeling in Autism自闭症是一种异质性的神经发育疾病,基于功能磁共振成像的研究有助于推进我们对其对大脑网络活动影响的理解。我们回顾了使用功能连接和症状的测量的预测建模如何帮助揭示对这种情况的关键见解。我们讨论了不同的预测框架如何进一步加深我们对复杂自闭症症状学基础的基于大脑特征的理解,并考虑预测模型如何在临床环境中使用。在整个研究过程中,我们强调了研究解释的一些方面,如数据衰减和抽样偏差,这些都需要在这种情况下进行考虑。最后,我们提出了自闭症预测建模令人兴奋的未来方向。
自闭症谱系障碍(以下简称自闭症)是一种神经发育障碍,其特征是社会交流和互动困难,行为受限和重复,对感觉信息的非典型反应。自闭症特征治疗,特别是在医疗干预方面的经验有限。通过确定个体化干预的目标,提高我们对这种疾病的脑基础特征的理解的方法最终可以指导临床研究和实践。
功能性磁共振成像(fMRI)连通性分析已经产生了定位支持特定行为的脑回路的工具。这些方法可以用来推断通过预测模型验证的个体层面的脑行为关系。基于预测的方法提供了一个统计上严格的框架(通过使用单独的数据进行模型训练和测试)来研究个体差异,特别是在神经发育疾病。在这里,我们断言模型在自闭症中有两个广泛的实用领域:1)加深我们对功能连接如何结合从而产生复杂自闭症症状学的理解(以下为生物学见解);2)潜在地帮助诊断、预测、干预计划和干预反应的监测(以下为临床应用)(图1A)。
图1 预测建模在自闭症中的应用。
考虑到这两个方面,我们回顾了自闭症预测建模文献,重点关注使用MRI功能连接数据的研究。与自闭症的终生性质一致,我们考虑了参与者年龄范围(6个月到65岁)的广泛研究。在详细介绍了自闭症特异性研究设计的考虑因素之后,我们讨论了三个预测建模框架:病例对照分类、维度预测和子类型应用(图1B)。在每个部分,我们强调基于大脑的见解,并确定我们期望预测模型产生临床效用的领域。因为基于大脑的见解是临床有用模型的基础(反之亦然),我们将它们的讨论编织在整个文本中,以强调它们的相互依赖性。这篇综述的目的是强调感兴趣的关键论文,并讨论可以使自闭症预测模型更有用的概念性考虑因素。我们的目标不是对自闭症预测研究中的机器学习方法/算法进行详尽的、系统的综述。
1. 预测建模的自闭症特异性考虑
1.1 预测模型提供生物学见解和潜在的临床用途
为了本综述的目的,预测建模包含了使用统计将MRI功能连接度量与表型度量(诊断状态/症状)关联起来的方法。这些方法将数据集分离为训练和测试样本,然后应用交叉验证或使用外部数据来测试模型。在这里,我们强调通过预测建模选择的功能特征(连接和网络)和它们提供的潜在生物学见解/临床相关性。例如,考虑一个模型,它暗示额顶叶区域的连接对社会注意力很重要。这样的模型通过定位电路产生了对复杂表型的生物学见解。通过预测哪些个体最有可能对行为干预产生反应,该模型可能在未来显示出临床效用。
1.2 平衡大样本量,关注数据衰减和站点效应
对自闭症参与者和神经典型参与者的预测建模研究表明,需要大样本才能获得可复制的结果。在自闭症领域,使用大型数据集通常意味着使用来自自闭症脑成像数据交换(ABIDE)和/或欧洲自闭症干预开发新药多中心研究(EU-AIMS)的数据。这些样本的一个问题是数据衰减,并与敏感性和特异性有关(病例对照分类研究的相关性概念;敏感度是一种算法对自闭症患者进行正确分类的能力;专一性是一种算法,它能正确地将没有这种疾病的典型神经个体分类。数据衰减意味着随着时间的推移,样本揭示新的统计上显著关系(如敏感性/特异性)的能力随着在样本中执行的统计检验数量的增加而下降。对数据衰减的担忧并非自闭症研究独有;使用阿尔茨海默氏症神经成像计划(ADNI)数据集的人也发现了类似的问题。
此外,ABIDE和EU-AIMS包括来自多个站点的数据。必须注意确保现场效应不会混淆结果;ComBat是研究人员用来最小化现场影响的一种方法。为了帮助进一步减轻对数据衰减和位点效应的担忧,可以使用其他样本来进一步验证预测模型,就像对其他表型所做的那样。使用多个数据集来确保结果在样本间保持不变是增加结果普遍性的一种方法。我们描述这些问题是为了提高人们的意识;我们强烈提倡公开共享数据集。
1.3 混淆,扫描环境的可容忍性,和预测建模的结果
混杂,或与模型中的自变量和因变量都相关的变量,可以驱动虚假的统计关系,并导致错误的结论。在测量功能连通性方面,扫描仪头部运动是一个臭名昭著的混乱现象,也是自闭症领域的一个关注。执行全局信号回归可以减少运动伪影,并在自闭症患者和神经正常个体中加强脑-行为关系。实现全局信号回归并非没有争议,包括全局信号回归如何改变功能相关结构和影响组间比较。
除非采用一致的方法来消除头部运动的影响,否则在模型构建中经常排除高运动数据的个体。这种做法影响了预测建模研究中的参与者。与此相关,能够接受功能磁共振成像扫描并产生低运动数据的自闭症患者往往有较少的语言/认知障碍和较高的智商。当考虑在临床环境中使用预测建模的可行性时,必须记住这些事实。为了使满足数据质量标准的自闭症患者多样化,成像协议的长度通常通过缩短功能扫描(5分钟)和取消任务扫描来最小化。代价是获得的数据范围有限。更少、更短的扫描导致更不可靠的功能连接组,静息状态数据往往产生较差的预测性能(在神经典型个体中)。混淆的确切解决方案取决于分析目标,但我们建议读者参考英国生物银行的混淆检查(以及解决它们的方法)。为了提高功能性连接体的可靠性,我们建议收集更多的扫描数据(包括任务和休息数据)和/或使用提高扫描数据质量的方法[Framewise集成实时MRI监测,模拟扫描协议,Inscapes]。
1.4 共病和表型重叠
自闭症患者有很高的并发率,包括注意力缺陷/多动障碍(ADHD)、焦虑障碍和智力障碍。共病可能给研究人员带来挑战,包括如何对不同的诊断进行共变。链接分析方法(即,维度和子类型方法)是一种解决方案。例如,有焦虑症状和没有焦虑症状的个体可以被分组为先验亚型,并且可以生成单独的维度模型来预测每一组的自闭症症状。允许参与者在不同程度上表达子类型特征的方法(多维子类型)在解析异构性方面也显示出了成功。
1.5 自闭症的性别失衡和预测模型中的性别特异性效应
性别效应在自闭症的预测建模中起着重要作用。据估计,在诊断中男女比例为3:1,自闭症的神经生物学也存在性别差异。女性和男性往往表现出不同的症状,往往导致女性漏诊。此外,预测神经典型个体的流体智力的模型在为每个性别分别生成时显示出更高的准确性,模型的功能特征是性别特异性的。性别特异性与使用神经典型个体的连通性数据预测性别的高度准确性一致。因此,研究人员应该在分析中纳入同等数量的男性和女性(在可行的情况下)和/或建立性别特异性模型。我们接下来强调所有这些因素如何影响自闭症预测建模的生物学和临床效用,我们回顾了三种不同的方法:病例对照分类、维度表型预测和子类型特异性预测。
2. 病例对照分类:侧重诊断的病例
病例对照分类研究构成了大多数自闭症预测文献(表1)。这些研究的优势在于其明确的性质:参与者被正确分类或未被正确分类。与维度和子类型预测研究相比,该研究的另一个优点是数量大,可以观察到广泛的趋势。下面,我们从发育的角度,从婴儿期到成年期(65岁以上),重点介绍了其中一些研究的生物学和临床用途。
3. 自闭症分类中涉及的基于大脑的特征在整个生命周期中是不同的
自闭症是一种终身疾病,其症状会在个体的一生中发生变化。发育变化反映在神经生物学的相关因素中,将自闭症个体与正常的参与者区分开来。例如,使用高斯核支持向量机和来自ABIDE的静息状态数据,Kazeminejad和Sotero已经表明,5至15岁儿童自闭症状态的最具辨别性的功能特征(涉及顶叶和腹侧前额叶皮质的连接),与15至30岁儿童的最具辨别性的功能特征(涉及背外侧前额叶皮质和颞叶皮质的连接更多)不同。在所有研究中,发育影响的总体主题:在生命周期的不同阶段,区分自闭症病例和正常神经参与者的功能网络组织似乎是不同的。在使用t1加权结构MRI数据的病例对照研究中,跨寿命的差异也存在,并与大脑成熟的动态性质相一致。
从这些证据中,我们得出两个结论。首先,不能在不同年龄组间推广的预测模型不应被视为模型失败。自闭症病例控制分类的年龄特异性模型可能是最大化模型效用的必要条件。这一观察结果与对儿童(11 - 18岁)进行的纵向研究一致,表明自闭症患者和非自闭症患者的功能网络变化速度不同。其次,鉴于证据越来越多,我们可以进行一些总体观察,并设计新的假设进行检验。例如,皮质区域的成熟轨迹倾向于遵循一个分级的感觉-联想轴。单峰感觉区在儿童期成熟,异峰联想区在青春期和青年期成熟。在自闭症中观察到这个层次结构的破坏,使得在分类的背景下考虑这个轴变得有趣。也许沿着这条功能轴的发育偏差可以用来更准确地区分自闭症患者和非自闭症患者?未来,研究人员可以在大型数据集中调查这一假设,同时牢记自闭症特有的预测建模问题 (表1)。
表1
4. 临床用途:促进早期诊断
临床相关研究的一个主要推动方向是在发展的早期阶段使用客观的生物标记来识别自闭症患者(图2),此时支持服务是最有效的。使用功能连接数据对病例控制状态的准确预测已在5岁以下的个体中得到证实。在一项更小年龄的研究中,Emerson等人使用了6个月大的婴儿睡觉时成像的功能连接数据,并表明支持向量机可以用来预测24个月大时的自闭症状态(图3A)。驱动正确分类的网络模型是复杂的(图3B),包括分布在整个大脑的短期和长期连接,其中许多连接聚集在顶叶皮层。成功模型的神经解剖学复杂性是我们将在这篇综述中注意到的主题。
图2 自闭症干预的窗口
图3 使用婴儿脑功能连通性的测量,病例对照预测是可能的。
自闭症诊断可以在年轻时预测的证据是有希望的,并为更早的生命成像奠定了基础。来自基因研究的发现表明,自闭症特异性转录通路的变化可能在妊娠期很明显。鉴于胎儿成像技术的出现,未来的预测模型可能会被生成,以评估出生前自闭症的可能性,从而使支持服务在出生时可用。
5. 量纲预测:复杂症候的解释
包括自闭症在内的许多精神疾病的症状是连续存在的,而构成适应性行为与发散性行为之间的界限往往不明确。从生物学的角度来看,维度方法可以用来描述特定行为领域的功能,并识别大脑连接的潜在模式。然后,在干预后可对相关的功能回路进行临床监测。尽管有这些优势,但只有少数维度预测研究(表2)。下面,我们重点介绍两个领域的工作:症状的预测和对适应功能重要的认知表型的预测。
5.1 预测自闭症症状
Plitt等人进行了第一批展示维度症状预测的工作之一。在一个青少年和年轻人的样本中,作者使用来自先验网络(默认模式[DMN],突出性和额顶叶网络)的静息状态连接数据来预测(使用岭回归)3年后社会行为的变化。这个早期的报告令人兴奋,因为预测方法可以用来询问与复杂症状相关的功能联系。从那以后的工作中,我们使用了更多来自ABIDE的样本,来搜索与症状相关的全脑范围。例如,使用静息状态数据和基于连接体的预测建模,Lake等人生成了预测社会反应量表(SRS)得分的网络模型,以及预测自闭症诊断观察计划得分的独立模型(图4A, B)。虽然两个模型有一些共同的区域(小脑和皮层下区域,这些区域越来越被认为在认知和社会过程中很重要),但它们在很大程度上是不同的。检测到不同的功能回路的事实是令人鼓舞的:尽管这两种量表都测量社交能力,SRS和自闭症诊断观察量表的得分只在一定程度上相关,认为大脑和表现型之间潜在的微妙关系可以通过预测方法检测到。
图4 自闭症症状的维度预测
一旦建立,模型可以应用到不同的数据集,以测试普遍性,并确定不同的群体或表型是否共享神经生物学相关。例如,Lake等人将构建的用于预测自闭症个体SRS评分的基于连接体的预测建模网络(在ABIDE中生成)应用到一个独立的ADHD儿童样本(ADHD-200),并发现该模型预测了注意力不集中的症状(图4C)。这是值得注意的,因为自闭症和多动症的高并发性,因为模型中存在的大脑区域(小脑、皮层下区域和DMN),这些区域被认为对内部和外部注意的中介方面很重要。DMN也被发现在心理理论和社会推理中起着重要作用,这些过程在自闭症中通常是非典型的。通过两个网络模型的组合,一个用于预测交流,另一个用于预测社会互动能力,DMN也成为预测自闭症患者社会情感的关键。这些结果表明,尽管自闭症的症状很复杂,但在各种研究中找到神经生物学的共性是有可能的。
5.2 预测与适应性功能相关的表型
一个临床兴趣的途径是生成适应性功能的维度预测模型。为此,Rohr等人利用来自ABIDE的静息状态数据和基于连接体的预测建模,生成了预测自适应功能的一个组成部分的网络模型,即抵抗不适当行为冲动的能力。他们的行为抑制模型包括分布式的全脑功能特征,大部分在默认模式、躯体运动、视觉和小脑区域内或之间,与其他工作一致。这些发现指出了识别相关标记的可行性,可以跟踪测量行为干预后的改善。监测对干预反应的适应性功能的概念与预测未来的个体结果是密切相关的。Plitt等人的工作表明,这对自闭症患者来说是可能的,因为在成像后3年,可以(显著地)预测整体适应功能的变化。使用结构和功能MRI数据,规范建模方法已被证明在解开自闭症脑-行为关系的异质性方面是有用的;未来的工作可以应用这些模型来产生纵向表型预测。未来的研究还可以采用多维的方法来预测不同表型的组合,以及结合功能连接动力学的测量。
6. 子类型:通过寻找共性来简化复杂性
人们对确定自闭症亚型很感兴趣。这项工作旨在识别同质集群,以询问每个子组的生物学基础,为潜在干预提供更具体的信息。多种模式的结果支持自闭症中存在不同的聚类,包括结构MRI、脑电图、眼球跟踪和症状级测量。
6.1 连接体子类型的初步研究
基于聚类功能连接组的分型方法表明至少有两到三种自闭症亚型 (表3)。与维度模型识别的分布式大脑特征一致,分型方法表明不存在区分亚型的脑聚焦区域;基于大脑的区分子群体的特征是复杂的和空间分布的。然而,DMN和额顶神经网络(涉及维度模型)似乎最一致地参与了区分子类型。到目前为止,大多数的研究都是在遵规律性研究中进行的,而且往往以男性为中心。未来的工作应该评估不同数据集中的子类型的可靠性/可泛化性,包括更多的女性参与者,并使用休息和任务数据的组合。虽然大多数研究都专注于识别非重叠的子类型,但复杂的分析方法允许参与者在不同程度上表达不同的子类型,维度子类型开始被报道,这是热情的原因。
在确定了基于连接体的子类型之后,通常通过确定子组之间是否有其他度量(通常是症状信息)不同来验证它们。例如,Easson等人将k-means聚类应用于来自stand的静息状态功能连通性矩阵,并观察到两种不同的亚型(图5)。亚型由自闭症患者和非自闭症患者的混合组成。两种亚型在连通性上都有很大的差异。第一种亚型的显著特征是DMN与扣带-盖、躯体运动和视觉网络之间更强的连接。第二个子类型表现出更强的网络内连通性。此外,每种亚型在脑-行为关系上表现出不同。也就是说,每个亚型中独特的连通性特征分别预测了SRS和自闭症诊断观察量表得分。
图5 自闭症中的连接体亚型
6.2 脑行为预测模型的子类型研究
Easson等人确定的子类型显示出明显的大脑-行为关系,这一事实暗示了子类型大脑-行为预测模型的可能性。至关重要的是,这些亚型不仅基于大脑或表现型,还基于它们之间的关系,这使得它们与假设单个大脑表现型预测模型在样本中足够的工作不同。基于模型的子类型所揭示的分组可能有助于发现跨越诊断和人口统计学界限的个体集群。除了数据驱动的方法之外,假设驱动的基于模型的子类型也可能被证明是有用的,无论是基于症状概况还是其他测量成本较低的变量,如生理性别。总的来说,通过基于模型的子类型得到的基于大脑的特征将有助于深入了解自闭症的生物学基础。不同亚型的表型和人口统计学特征可能有助于对个体进行分诊,以便更好地护理管理。
7. 限制
有人对功能连接的可靠性表示关注。有研究表明,如果每个参与者都有足够的数据(每次扫描15分钟,可以对连接进行更可靠的估计),自闭症患者和神经正常患者之间的连接组会变得非常相似。这里报道的大多数研究只包括5分钟的扫描。可以进行更多的工作来确定增加数据量如何影响预测模型的准确性和可靠性。除了可靠性,功能连接的精确生物学性质仍然难以捉摸,这是预测建模研究必须承认的一个问题。病例对照研究的一个问题是将个体归为单一类别。自闭症患者有独特的症状特征和复杂的神经生物学相关症状。分类诊断使得很难确定一个表现型的具体方面是如何由潜在的脑回路支持的。此外,预测诊断在临床上是不够的;需要更多个人层面的信息来优化护理。人们已经对精神病学中的维度研究提出了担忧。例如,自闭症患者的严重沟通障碍可能是不同的神经生物学过程的结果而不是神经正常个体的支持沟通能力的过程;假设所有个体都可以被定位在一个给定表型的单一维度上,这可能是不正确的。某些维度指标(SRS)依赖于家长/自我报告测量;这些测量可能与感兴趣的症状或行为构想关系不大。维度方法可能无法用于建模所有脑表型关系,由于维度的诅咒,计算约束可能会限制维度方法的实用性。一些精神疾病的子类型已被证明很难在数据集之间复制,最近的一项研究报告无法定义自闭症的可靠子组。继续测试自闭症亚型的可重复性和可泛化性将是至关重要的。此外,对亚型的解释可能因未测量的、样本相关的协变量而复杂化。收集精确和包容性的人口/临床数据可用于纠正混淆,尽管隐藏的混淆可能持续存在。
8. 未来的方向和结论
我们已经回顾了预测建模框架如何提供洞察自闭症的神经生物学相关,以及潜在的临床效用。目前,病例对照分类研究包含了大多数文献,允许观察发展趋势。由于自闭症个体的异质性,需要更多的维度和分型预测研究。所有三种预测框架都可能受到这里讨论的自闭症特定建模考虑因素的影响。分类方法也许有一天能够使用客观的生物学数据进行早期诊断(甚至可能是在子宫内)。同时,维度和子类型研究可以加深我们对自闭症背后基于大脑的特征的理解,并通过基于图像的预测和干预反应监测发现改善管理的方法。
与自闭症症状的复杂性一致,基于大脑的预测模型是复杂的,揭示了支持特定行为的大规模网络。为了帮助解释和翻译,继续收集大型数据集是必不可少的。理想情况下,数据集应该是广泛的(大量不同的自闭症患者和非自闭症患者)和深入的(包括许多数据模式)。通过广泛而深入的方法获得的生物学见解的一个例子是确定特定的遗传特征是否构成了不同的连接表型,将基因、复杂的大脑活动模式和自闭症的行为表型联系起来的出色工作开始出现。深度、多模态聚焦可能提供fMRI和功能性近红外光谱或脑电图共同的标记,提供可用于临床的补充信息(而且比fMRI更便宜,一些人更能忍受)。对相同的参与者进行多次成像的密集扫描方法已被证明对神经正常的成年人有用。
结合创新的任务范式,如看电影,密集扫描可以在自然的社会环境中提供大量个人层面的数据。这样的方法可以帮助自闭症研究人员更好地分析参与者特定的轨迹。理想情况下,密集扫描计划将包括许多个体,以最大限度地检测个体差异(更多关于自闭症的密集扫描见附录)。我们并不认为前进的道路是容易的。尽管人们对fMRI的期望很高,但到目前为止,fMRI在很大程度上未能使自闭症患者受益。除了产生可靠的功能磁共振成像结果的困难之外,还有许多点的发现可能无法转化。研究和临床重点并不总是一致的,因此在研究人员、临床医生、自闭症患者和他们的护理人员之间保持开放的渠道是至关重要的。展望未来,我们设想预测建模方法将继续帮助探索理解自闭症的复杂神经生物学。
参考文献:Functional Connectome–Based Predictive Modeling in Autism