摘要:近年来,人们对利用技术进行心理健康研究产生了极大的兴趣。技术的快速发展促使研究人员将技术应用于神经发育障碍(ndd)的诊断和治疗过程。随着大量研究的发表,迫切需要向临床医生和研究人员通报这一领域的最新进展。在这里,我们系统地探索和总结了2019年8月至2022年2月期间发表的研究结果。纳入了221项定量研究,涵盖了用于诊断和治疗ndd的广泛技术,其中最大的重点是自闭症谱系障碍(ASD)。最受欢迎的技术包括机器学习。综述结果表明,基于技术的NDD人群诊断和干预是有希望的。然而,鉴于许多研究存在较高的偏倚风险,需要更多高质量的研究。
1. 引言
根据《精神疾病诊断与统计手册》,神经发育障碍(ndd)是一组早期发病的疾病,其特征是各种缺陷,损害个人、学术、社交或职业领域的功能。近年来,ndd成为儿科人群中最常见的诊断之一,其中最常见的诊断是学习障碍,患病率约为8%,发展性语言障碍7%,自闭症谱系障碍(ASD, 2%),以及注意缺陷多动障碍(ADHD, 2%)。诊断本身可能具有挑战性,因为各种共病在NDD人群中不是例外,而是一种规则。另一个挑战是不同疾病之间一定程度的表型重叠,以及一种具有相同诊断的个体的症状和功能水平差异很大。早期发现ndd非常重要,因为它可以快速干预,改善儿童预后并最大化治疗效果,因为人类生命最初几年的神经可塑性很高。然而,转介进行NDD评估的患者在接受诊断时往往会遇到严重延误。根据最近发表的一项研究,40%的家庭在首次就诊后六个月仍在等待诊断。此外,在加拿大进行的研究表明,从转诊到收到ASD诊断的中位总等待时间为7个月。此外,一旦确诊,家庭往往要处理在开始治疗方面的严重延误和缺乏令人满意的治疗监测。例如,只有20%的图雷特综合症年轻人有机会接受行为抽动治疗,而那些接受治疗的人通常只参加不到建议次数的一半。造成这种情况的原因之一是缺乏训练有素的治疗师,特别是在地理上偏远的地区,以及临床时间不足,无法提供最佳护理实践。因此,为ndd的诊断和治疗确定具有时效性和易于获取的策略的重要性是显而易见的。
技术有可能提高早期筛查和后期治疗的可用性。针对ndd的技术干预措施数量呈指数级增长。例如,人们对使用机器学习技术支持ASD诊断很感兴趣。在整个文献中,它被应用于不同类型的数据,如神经成像数据、眼动数据、运动学数据、音频样本或标准化评估(例如,自闭症诊断访谈,修订或社会反应量表。在最后一种情况下,研究人员经常寻求提高标准测试的准确性,因为它们有时无法区分一种情况和另一种情况。可获得数据的数量和种类的增长主要是由于用于收集数据的仪器和基础设施的可负担性,但也得益于世界各地的科学家和临床医生之间共享数据的趋势。这种倡议的一个例子是广泛使用的自闭症脑成像数据交换(ABIDE)数据集。其中包括静息状态功能磁共振成像(rs-fMRI)数据以及相应的ASD和神经正常参与者的结构MRI和表型信息。另一个例子是ADHD-200存储库,它包含相同类型的神经成像数据,但从ADHD和典型发展(TD)受试者中获取。最重要的是,许多开源机器学习工具包的可用性,加上计算能力和处理技术的提高,为研究人员在诊断过程中利用机器学习创造了机会。
“技术”一词涵盖了广泛的设备、模式和技术:虚拟现实、眼球追踪、可穿戴技术、移动应用/平板电脑、不同形式的医学成像、神经反馈、生物反馈、机器人、经颅磁刺激、脑电图(EEG)、混合现实、严肃游戏等。Valentine及其同事最近发表的系统综述探讨了临床疗效、服务效率、经济和用户影响,以及临床采用用于评估、监测和治疗ndd的技术的准备情况。作者探索了2019年8月之前发表的研究,排除了与神经成像、神经刺激/调节/反馈/训练或生物标志物测试/设备相关的技术。在我们的工作中,我们没有排除这些技术,以便全面了解当前的趋势。此外,为了不与上述审查重叠,并对最新技术进行概述,我们决定从2019年8月开始我们的搜索期。虽然在系统综述中涵盖的时间似乎很短,但考虑到最近与技术相关的出版物和技术发展本身的快速增长,覆盖近3年的研究可以说比从很长一段时间合成证据更有意义。迫切需要更新临床医生、治疗师和一般专业人员在NDD诊断/治疗中使用技术的最新进展,总结最近的发现可以使他们更清楚地了解到目前为止所取得的成就。此外,它将支持研究人员决定他们未来的研究方向。最近的系统综述主要集中在特定疾病的特定技术的使用上,例如,智力残疾人士的严肃游戏,社交机器人在ASD治疗中的应用,或者在多动症中的神经反馈的使用。鉴于近年来在心理健康研究中应用技术的极大兴趣,本综述的目的是分析和组织ndd诊断和治疗技术应用的最新趋势。本工作综合了现有的定量研究和系统地探索在这一领域的证据的现状。
2. 方法
2.1 搜索策略和纳入/排除标准
根据系统评价和荟萃分析(PRISMA)指南的首选报告项目详细阐述了该综述。审查方案已注册,可通过PROSPERO (CRD42020160939)访问。搜索在PubMed和APA Psycinfo数据库中进行。我们的搜索策略结构基于人群、干预、比较和结果(PICO)域。
主题标题(MeSH)术语,以正确地检测有关该主题的可用文献。我们决定不只关注设备本身,而是关注任何可能改进现有方法的诊断/治疗技术支持,因此干预部分还包括与机器学习和人工智能相关的术语。PubMed的搜索仅限于人类。在APA PsycInfo中,我们也选择搜索相关和等效的术语。没有语言限制。我们对2019年8月至2022年2月被索引的文章进行了系统的搜索策略。我们选择在2019年8月开始搜索,因为该领域的最新系统综述在该时期结束了其搜索策略。入选标准:1)涉及人类受试者的研究,2)使用表1中干预项下报告的至少一种技术,表1中的干预领域包括通过PubMed初步搜索确定的其他最常用的技术类型),3)包括至少具有表1中描述的一种ndd的参与者。4)专注于治疗和/或诊断(以确定可能适用于临床实践的技术)。此外,为了在相关人群中测试技术的直接使用,技术必须直接用于ndd患者,而不是受试者的父母、从业人员等。排除标准:社论、评论、调查、论文、案例研究、病例系列、动物研究、纳入无NDD受试者并将其与诊断为NDD的受试者一起分析的研究(以避免混淆),或关注遗传数据或生物样本,如粪便或血液样本(以避免纳入研究的过度异质性)。
2.2 研究选择过程
使用搜索策略检索到的作品被导入Rayyan, Rayyan是一个网络和移动应用程序,支持进行系统审查并与其他作者合作。识别、筛选和纳入研究的过程见PRISMA流程图(图1)。如果两位作者对某项研究的纳入/排除有任何冲突,则咨询第三作者。
图1 PRISMA流程图,展示研究筛选和选择过程。
2.3 偏倚风险/质量评估
对于偏倚风险/质量评估,根据研究设计使用了各种工具。对于病例对照和队列研究,选择了纽卡斯尔-渥太华质量评估量表(NOS)中的适当工具。两种类型的研究的最高分数都是9分,分数越高表明质量越高。纳入的随机对照试验(rct)采用修订后的Cochrane平行组试验或交叉试验的偏倚风险工具进行评估。根据研究设计,该工具分为5或6个领域,例如,随机化过程产生的偏差,交叉试验中由于期效应和延续效应引起的偏倚风险,或由于偏离预期干预而引起的偏倚风险。
2.4 数据提取
每项研究的提取信息包括:标题、作者、发表年份、国家、资金来源、利益冲突、研究设计类型、目标人群描述(研究对象的数量)、参与者、性别、年龄和NDD诊断类型)、NDD评估工具、目标人群的纳入/排除标准、用于诊断和/或干预的技术、操作人员和应用地点(例如,家庭、实验室)、靶向(生物)标记物/症状和结果。由于纳入的研究存在较大的异质性,不仅ndd范围广、使用技术多,而且研究设计、人群年龄和性别、结局指标、随访时间等方面均存在较大的异质性,因此无法进行meta分析。因此,我们选择以叙事的方式综合研究。
3. 结果
在2019年8月至2022年2月期间,共进行了4108项研究通过数据库搜索确定。另外选取7条记录进行参考挖掘筛选。删除重复项后,3717剩下的记录由两个独立的au检查是否合格作者先通过摘要筛选,然后通过阅读543篇全文文章)。最后纳入221项研究。这项研究是在42个不同的国家进行的。
只有10.4%的研究(n = 23)入组至少50%的女性受试者。此外,6.3%的研究(n=14)全部是男性样本。在66.1%的研究(n = 146)中,作者声明未知竞争利益,18.6% (n=41)的出版物不包括任何利益在这方面,15.4% (n=34)的受访者披露了某些欺诈行为利益冲突。更多的研究(68.8%)使用技术进行诊断,而不是ndd的治疗。
绝大多数文章(61.1%)关注的是泛自闭症障碍。
表2每种疾病的研究数量及其类型(调查诊断/治疗)。
用于支持ndd诊断的最常见技术是:机器学习(n=135, 61.8%)、功能磁共振成像(fMRI, n=45, 20.4%)、脑电图(n=37, 16.7%)、磁共振成像(MRI, n=26, 11.8%)和眼动追踪(n= 11, 5.0%),其次是移动应用程序/平板电脑(n=5, 2.3%)、计算机视觉(n=3, 1.4%)、运动捕捉系统(n=3, 1.4%)、虚拟现实(n=2, 0.9%)和脑磁图(MEG, n=2, 0.9%)。此外,单个研究使用了:带触摸屏的树莓派、经颅磁刺激、功能性近红外光谱(fNIRS)、磁共振光谱(MRS)、超声(USG)、心电图(ECG)、热成像、智能眼镜、智能手机、允许手写运动运动学分析的数字化仪、测力板、机器人和计算机应用与干式传感器单通道便携式脑电图耳机。
关于治疗研究,最常用的技术包括:神经反馈(n= 17, 7.7%;基于EEG, n= 15, fNIRS, n=1,或fMRI, n=2),移动应用程序/平板电脑(n=10, 4.5%),虚拟现实(n=8, 3.6%),机器人(n=7, 3.2%),经颅磁刺激(n=6, 2.7%),眼动追踪(n=5, 2.3%),经颅电流刺激(n= 4, 1.8%)和Xbox Kinect (n= 4, 1.8%)。不太流行的技术包括:生物反馈(n=3, 1.4%,脑电图,或基于肌电图,或心率变异性),基于电脑游戏的干预(n=3, 1.4%),远程医疗(n=3, 1.4%),任天堂Wii控制台(n=2, 0.9%)和混合现实(n=2, 0.9%)。此外,单个研究使用了:弹性触摸显示器“BendableSound”,同时减缓视觉和听觉信号的在线软件包,用于慢速治疗,增强现实,动作捕捉系统,智能扬声器,基于大细胞的计算机化视觉运动训练,以及无线电电不对称输送机(REAC)。应当指出,有些研究包括一种以上的技术,因此所提供的数字加起来不等于221项。
3.1 偏倚结果风险
在纳入的33项随机平行组试验中,只有1项被评为低偏倚风险,21项被评为高偏倚风险,11项引起了一些关注。在以下领域观察到最低分数:由于缺少结果数据和结果测量中的偏差。在这些领域中,有11项研究被评为具有高偏倚风险。此外,由于大多数研究人员没有预先登记他们的数据分析意图,因此大多数研究(n = 26)被评分为在报告结果域的选择中引起了一些关注。所有5项随机交叉试验均存在高偏倚风险。在以下领域中,它们都没有低偏倚风险:随机化过程引起的偏倚,交叉试验中偏离预期干预措施(分配干预措施的影响)引起的偏倚,以及交叉试验中报告结果选择的偏倚风险。NOS评估量表结果见图2。S6和S7。关于EPOC工具的结果,10项研究中只有1项被评为“风险较低”。21项纳入的前后研究均未被评为质量良好。
图2每年纳入的干预性和观察性研究的数量。
3.2 调查(生物)标记物和目标症状
在本节中,我们总结了所纳入研究中调查的(生物)标记物和症状。我们将它们分为三个相对广泛的类别,并对每个类别的研究结果进行了总结。考虑到研究的数量多、种类多,每项研究的结果都可以在补充资料一中查阅。
3.2.1 大脑结构和活动
56.6% (n = 125)的纳入研究调查了大脑结构和/或活动。85.6% (n=107)集中于诊断。具体来说,对ASD (n=69)和ADHD (n=33)的检测非常感兴趣,其次是阅读障碍(n=4)、发育迟缓(n= 2)、学习障碍(n=1)、图雷特综合征(n=1)和发育性言语语言障碍(n=1)。治疗研究包括以下情况:ADHD (n=9), ASD (n -5),抽动秽语综合征(n2),学习障碍(n1)和阅读障碍(n=1)。其中一半人应用神经反馈训练,其他人使用经颅磁刺激(n4)、经颅电流刺激(n-3)、虚拟现实治疗(n=1)或游戏。
使用各种工具研究大脑活动和结构。47项研究分析了脑电图数据,其中35项涉及诊断。例如,Bakheet和Maharatna在向自闭症和自闭症儿童展示三种面部表情的同时,获得了他们的脑电图信号。在快乐刺激数据集上训练的算法在区分ASD和TD参与者方面达到了100%的准确性。此外,Peng及其同事通过获取和分析积极和消极情绪刺激下受试者的脑电图数据来筛查自闭症。在另一项研究中,Zhao及其同事进行了复发定量分析(RQA),可以推导出自闭症和神经正常参与者不同脑区脑电图信号的确定性(DET)、复发率(RR)和平均对角线长度(LADL)等特征。使用来自整个大脑区域的数据和支持向量机,作者实现了84%的最大分类准确率。其他研究人员检查了大脑C3通道的脑电图信号,并提出了复杂网络拓扑特征之间的差异,作为ASD检测的一种方法。此外,Gabard-Durnam和合著者发现脑电图出生后第一年的权力轨迹可以区分3岁时的ASD结局。Kang及其同事的研究揭示了低功能自闭症受试者和TD对照组在EEG熵、功率、一致性和双相干性方面的差异。脑电图也用于支持ADHD的诊断。例如,Boroujeni及其同事分析了脑电图信号的混沌行为,使他们能够将ADHD受试者与对照组区分开来,准确率为96.05%。Chang及其同事研究了多种脑电图特征来检测男性混合型ADHD。这些特征的例子包括:阿尔法/伽马波段的功率比,脑电图信号的平均值,或男性多动症参与者信号所有频谱波段中贝塔波段的功率。利用脑电图检测ADHD的其他想法包括:重构脑电图信号的相空间或从连续心理任务脑电图样本的theta、alpha、beta和gamma频段形成的RGB图像中提取特征。
本综述中只有三项研究使用脑电图诊断除ASD和ADHD以外的疾病。其中一项研究是由Elvira及其同事进行的,他们将实时z-score NF训练应用于有学习障碍的学龄儿童的定量EEG规范化。另一个是Lloyd及其合著者的研究,他们发现早产儿记录的多通道脑电图是2岁时发育迟缓的有力预测指标。最后一项研究通过分析静息状态脑电图网络的空间模式,成功地区分了患有和没有抽动秽语综合征的参与者。在本系统综述中,近20%的研究对结构、功能或有效的大脑连接进行了分析。他们大多使用公共数据集,如ABIDE和ADHD-200 。事实上,在纳入的221项研究中,35项研究分析了来自ABIDE数据集的数据,12项研究分析了ADHD-200的数据。例如,Shao及其同事试图识别可能作为诊断ASD的生物学依据的异常功能连接。他们提出了一种深度特征选择过程与图卷积网络相结合的方法。在第一步中,对每个功能连接特征进行加权,并相应地选择其中的一个子集(这要归功于在多层感知器的输入和第一个隐藏层之间添加稀疏的一对一层),然后,基于所选择的特征和额外的表型信息,将受试者分类为ASD或TD。作者使用预处理的ABIDE数据集验证了这种方法,并实现了79.5%的准确率。ElNakieb及其同事获得了非常有希望的结果,他们的方法在所纳入的研究中达到了最高的分类精度。
以前的研究表明,ASD患者从童年到成年的内部胶囊微观结构具有增强的连通性。20项研究调查了大脑解剖学(例如,皮质表面积、皮质厚度、白质体积),以区分病例和对照组。例如,Sarovic及其同事分析了患有和不患有ASD的个体的结构MRI数据,发现两组在皮层下灰质结构和边缘区域存在显著差异。作者还估计了每个受试者的个体总指数,该指数表明他们的总体脑形态模式是在病例还是对照组的方向上,并达到了78.9%的最大交叉验证分类准确率。此外,古尔比兹和雷基克调查了ASD个体的皮质表面积和最小主面积,Squarcina及其同事发现ASD儿童大脑各区域的皮质厚度增加。
另一方面,Öztekin及其合著者的一项研究表明,皮质解剖学的测量在区分患有和没有多动症的儿童方面几乎没有增加的价值。少数研究(n=6)使用功能磁共振成像(fMRI)研究了大脑对某些任务或刺激的反应。4例集中于诊断(ASD, n=2;阅读障碍,n = 1;多动症,n = 1)。Zahia及其同事试图根据三种不同阅读任务中包含大脑激活区域的体积来检测阅读障碍。参与者被分为阅读障碍组、典型发展组和单眼视力组。该模型采用三维卷积神经网络进行训练,总体平均分类准确率为72.73%。Haweel及其合作者使用基于任务的功能磁共振成像(fMRI)创建了一个大脑图谱(表明每个大脑区域的ASD严重程度),这有助于个性化诊断和治疗计划。大脑活动数据是在参与者自然睡眠时记录下来的,同时播放叙述者讲故事的录音。
另一项研究通过分析工作记忆、抑制控制和奖励处理任务中的激活来关注ADHD检测。在治疗研究方面,其中一项研究利用实时fMRI-NF来实现ASD患者fusiform面部区域的上调,而另一项研究则通过深经颅磁刺激来针对ADHD参与者注意网络中的神经活动。脑活动也用fNIRS技术评估。例如,Xu及其同事分析了短期自发性血流动力学波动和额下回和颞叶异常,并成功地对ASD和TD儿童进行了分类90.6%的敏感性和97.5%的特异性。另一项研究利用fNIRS-NF训练来降低ADHD总体得分。作者表明,61.9%的参与者学会了如何调节NF目标参数,其中任务是减少(“失活”)或增加(“激活”)前额叶OzHb浓度。另外,两项研究使用了脑磁图(MEG)。其中一项研究的结果表明,婴儿的神经非母语言语辨别可以显著预测6岁时口语语法技能的个体差异,以及是否存在潜在的言语语言障碍。具体来说,预测因子是11个月时脑磁图实验的前额叶失配反应,而不是颞叶失配反应。另一项研究发现振荡和振荡耦合的改变,反映了自闭症患者运动门控机制的失调,并利用这些发现对ASD与对照组进行分类,得到AUC等于0.971。
3.2.2 核心症状和其他NDD相关的困难
这一类包含的研究(n=104)不仅针对特定ndd的核心症状,而且针对与这些症状相关的常见困难,但对获得诊断并不重要。62.5% (n =65)的患者将技术用于治疗而非诊断。大多数研究集中在ASD (n=53), ADHD (n= 26)和学习障碍[n=13;阅读障碍(n=8)、未指明的学习障碍(n=2)、书写困难(n=2)和数学学习障碍(n=1)],其次是发育协调障碍(DCD, n=6)、智力障碍(n=3)、特定语言障碍/语言障碍/延迟(n=3)、图雷特综合征(n=2)和Rett综合征(n=1)。
41.3%的研究(n= 43)针对各种认知过程,如注意力(n=11)、执行功能(n=10)、阅读(n=6)、语言(n=4)和其他(如感知、信息处理速度)。例如,在Gallen及其合著者的一项研究中,对ADHD儿童进行了为期4周的针对额叶中线theta回路的iPad家庭干预前后,评估了注意力的神经、行为和临床指标。结果表明,干预后,注意力的神经和行为测量都有所改善。此外,Peters及其同事对阅读障碍人群进行了一项研究,该研究表明视觉注意力在阅读中起着重要作用,可以通过动作视频游戏进行训练。作者认为,它可以是一种激励、有趣和吸引人的阅读障碍干预。Ameis及其同事进行了一项随机对照试验,比较了针对背外侧前额叶皮层的重复经颅磁刺激(rTMS)与假刺激对ASD参与者执行功能表现的影响。使用剑桥神经心理测试自动电池SWM总错误和BRIEF元认知指数得分来测量结果。尽管4周20赫兹rTMS的疗效尚未得到证实,但在活跃组与假手术组的基线功能较低的参与者中,观察到执行功能的改善。阅读能力通常是对失读症人群进行干预研究的目标。在一项前后对照研究中,Eroglu等研究了一款带有脑电图神经反馈和多感官学习方法的移动应用程序(Auto Train Brain)对阅读理解、阅读速度和其他阅读能力的影响。结果表明,实验组学生的阅读理解能力明显高于正常治疗组,两组学生的音位意识和非单词拼写能力均有显著提高。Zorcec及其同事进行的另一项研究发现,在与儿童大小的人形机器人Kaspar互动并在家中使用辅助应用程序后,自闭症儿童在几个发展领域(包括语言技能)有所改善。机器人使用面部和身体表情、手势以及预先录制的语音进行交互。认知功能的一个常见测量是反应时间,以及遗漏和委托错误(n=6)。在巴西的一项研究中,自闭症儿童玩了一个增强现实游戏,他们必须识别正确的数字和字母,在干预后改善了他们的反应时间。
此外,本综述涵盖的ASD相关症状包括社交缺陷(n=14)、运动技能(n=8)、情绪识别和理解(n=7)、沟通问题(n=6)、社会注意力(n= 5)或焦虑(n= 3)。25项研究侧重于诊断,28项研究涵盖了各种治疗方法。其中一个干预想法是在治疗项目中引入机器人。例如,在Marino及其同事的一项研究中,一个塑料身体的人形机器人充当联合治疗师,提供情感和沟通提示,以及增援。社交机器人成功地促进了社会情感理解技能的学习。其他研究人员利用带有眼球追踪的交互式虚拟现实系统,使他们能够成功地增强ASD患者的凝视共享和凝视跟随。
Crowell及其同事使用全身互动的混合现实体验来检查它是否有助于减少自闭症儿童在与TD儿童玩耍时的焦虑和鼓励社会融入。这个混合现实系统被称为“雾之国”(mora - guard),它由投射到地板上的虚拟环境、物理对象(如系统跟踪的带有LED灯的蝴蝶网)以及视觉和声音效果组成。作者将这种方法与标准的乐高社会干预策略进行了比较,后者使用玩具和建筑工具作为护理人员、心理学家或治疗师的辅助工具。结果表明,实验组和对照组的儿童产生的社会启动次数相同,报告的焦虑没有显著差异。此外,在三项研究中研究人员旨在通过分析家庭视频中的行为特征来检测自闭症。被评估的特征包括表达性语言、模仿、眼神接触、自发手势、情感表达、沟通参与、反应、安慰他人、攻击性、分享兴奋等。他们是由没有ASD检测经验的人评定的。的最佳分类精度91.79%由Nabil等人使用倒向特征选择和支持向量机获得。他们还使用了三个研究中最大的数据集,包括116名自闭症患者和46名TD参与者。
研究运动技能的一个例子是由de Moraes及其同事进行的随机交叉对照试验美国专利。作者调查了患有自闭症的年轻人在真实和虚拟环境中的运动学习和转移,发现虚拟方法可以增强运动技能的学习。此外,Li及其同事使用机器学习自动识别ASD受试者的姿势控制模式。在两种情况下(睁眼和闭眼),使用一个测力板来收集压力中心数据。使用naïve贝叶斯分类器,他们成功区分患有和没有自闭症的儿童,最高准确率为0.90,特异性为1.00,灵敏度为0.83。值得一提的是,有8项研究将机器学习应用于已知的标准工具,通常还会附带一些关于个人特征的额外问题,如年龄、性别、种族、孩子是否出生时患有黄疸等。在这种情况下,研究人员试图优化现有的筛选过程,而不是寻找新的ndd标记物。更具体地说,使用的工具包括:幼儿自闭症定量检查表(QCHAT) ,自闭症谱系商成人(AQ-10成人), AQ-10儿童,第一年量表2.0 ,自闭症诊断访谈-修订版(ADI-R) 和DSM-5 ASD-299.00诊断标准。此外,一项研究利用了拍摄的自闭症诊断观察表(ADOS)评估中的社会互动的非语言方面。其中一些研究产生了令人鼓舞的结果。例如,Mujeeb Rahman及其同事使用深度神经网络进行ASD检测,波兰幼儿QCHAT和QCHAT-10数据集的AUC分别为97.18%和100%。关于ADHD相关的症状和困难,本综述包括的研究包括:注意力不集中、多动和/或冲动(n= 15)、工作记忆(n= 5)、运动技能(n= 3),以及相关的行为问题、一般精神病理、情绪问题和同伴问题(n=2)。大多数研究集中于治疗(69.2%,n=18),大多数研究利用神经反馈(55.6%,n=10)和虚拟现实(16.7%,n=3)。
Dobrakowski和Lebecka发现,进行10-12次神经反馈训练的多动症儿童的工作记忆有显著的长期改善,这些训练的θ和β频率范围分别调整为儿童的峰值α频率。此外,Wang及其同事发现,经过θ / β神经反馈训练后,父母在ADHD与正常行为优缺点(SWAN)评定量表上报告的ADHD症状减少。另一方面,Barth及其同事对成人样本进行的随机对照试验显示,半主动肌电生物反馈组、fNIRS神经反馈组和脑电图神经反馈组的核心ADHD症状改善同样显著,表明安慰剂或非特异性作用。
其他针对多动症症状的研究例子包括2019年的一项研究,在这项研究中,Benzing和Schmidt发现了游戏(将用户直接投射到屏幕上的虚拟现实中,并通过身体运动控制控制台)对执行功能、一般精神病理学和运动能力的积极影响。此外,Shema-Shiratzky及其合作者调查了虚拟现实对多动症儿童行为和认知功能的影响。这项研究的参与者在一个带着安全带的跑步机上行走,同时穿过虚拟的障碍物。训练后的父母报告显示,儿童的心身行为和社会问题有显著改善。此外,记忆和执行功能得到改善,并在6周的随访中保持效果。此外,有8项研究集中于诊断。在其中一项研究中,研究人员对ADHD儿童和对照组的快速笔划进行了运动学分析。他们发现,那些被诊断患有这种疾病的人表现出较差的运动计划和执行能力,以及更大的运动控制变异性。这些差异使他们能够成功区分曲线下面积(AUC)得分最高为0.91的两组。此外,Ardulov及其同事将机器学习应用于ADI-R项目,以区分ASD和ADHD。其他研究人员在视觉空间工作记忆任务中使用瞳孔测量变化作为ADHD的标志。在获得的数据上训练的支持向量机分类器在区分病例和对照方面达到77.3%的灵敏度和75.3%的特异性。
其余的研究将机器学习应用于父母和/或老师报告的ADHD症状,或其他一些行为特征,并结合其他测量方法,如脑电图(n=2), MRI (n=1), MRS DTI (n=1)和眼动追踪(n=1)。关于学习障碍,除上述认知过程外,纳入的研究还探讨了:从检测书写障碍的书写运动测试中提取的运动学特征,阅读障碍中的姿势控制,以及与学习障碍相关的情绪、认知和行为症状。此外,Appadurai及其同事提出了一组重要的眼球运动特征,可用于构建阅读障碍的预测模型。此外,所有关于DCD人群的研究都集中在治疗和目标运动能力上。例如,EbrahimiSani及其同事发现虚拟现实训练对该人群的预测运动控制功能有积极影响,Grohs及其同事表明运动皮质经颅直流电刺激并没有增强DCD儿童的运动学习,这在其他人群中也有发现。
此外,智力残疾研究完全集中在治疗上。其中一个成功地利用智能扬声器来提高成年人对与设备使用相关的短语以及不相关的单词的语音可理解性。另一项研究调查了虚拟现实和基于电脑游戏的认知疗法对视觉-运动整合的影响。采用前后研究设计,干预后的bruinink - oseretsky运动熟练程度测试-2 (BOT-2) 得分显著提高。
另一方面,3项关于特殊语言障碍/语言延迟/障碍的研究都侧重于诊断。其中一项使用机器学习的研究结果表明,作为一个男孩,社会经济地位较低,年龄较大,父母和老师报告的功能性沟通和读写技能较差,在区分有和没有临床语言技能障碍的儿童方面具有很强的歧视性价值。在另一项研究中,研究人员通过将机器学习和网络科学方法应用于早期语言技能父母报告,建立了低语言结果的预测模型。此外,Sharma和Singh 从原始语音信号中提取音频特征,并在区分有和没有特定语言障碍的个体方面达到了100%的准确率。
两项图雷特综合症的研究都旨在降低受影响个体的抽搐次数。Dyke及其同事研究了单次阴极经颅直流电刺激对这些症状发生的潜在积极影响。研究显示,与假手术刺激后相比,阴极刺激后的抽动障碍评分(使用视频数据评估)显著降低,但时间(前/后)和刺激(阴极/假手术)之间的相互作用并不显著。第二项研究的结果表明,神经导航机器人双侧重复经颅磁刺激辅助运动区在图雷特综合征儿童中是可行的,并减少他们的抽动严重性。
此外,一项干预研究针对Rett综合征中刻板印象的强度。作者比较了基本远程康复和高级远程康复系统的使用,这些远程康复系统配备了眼球追踪工具,以便治疗师可以在认知过程中监测患者与该系统的互动。高级干预还包括运动康复课程,提供患者骨骼的3D重建,实时叠加在视频上,以便更好地观察参与者潜在的运动改善。结果显示,与使用基本远程康复系统的小组相比,使用先进远程康复系统的小组的刻板印象明显减少。
3.2.3 其他功能
考虑到本系统综述中只有4.1%的研究(n=9)涵盖了与大脑结构或活动、典型NDD症状或与其相关的困难相关的其他特征,我们决定在一个章节中全部描述它们。其中一种方法是寻找独特的音频标记,以帮助区分ASD病例和对照组(n= 2)。Khozaei及其同事使用高质量的录音设备和典型的智能手机收集18至53个月之间自闭症和非自闭症受试者的哭泣样本。在对数据进行预处理后,他们训练了一个分类器,在男性数据集上的灵敏度、特异性和精度分别为85.71%、100%和92.85%,在女性数据集上的灵敏度、特异性和精度分别为71.42%、100%和85.71%。此外,Asgari及其合作者将机器学习应用于从ADOS-2会话活动中提取的语音特征,并在以下情况下实现了83%左右的最大AUC。
此外,在一项ASD诊断研究和一项ADHD治疗研究中,研究了心率变异性(HRV)。Frasch及其同事(Frasch, 2021)收集了ASD学龄儿童、年龄匹配的TD对照组和其他以HRV改变为特征的精神疾病(如行为障碍或抑郁症)的受试者的心电图数据。研究人员从时间、频率和几何信号分析域确定了ASD的特定特征,这些特征使自闭症参与者能够与他们的同龄人区分开来,AUC等于0.89. ADHD研究由Groeneveld及其同事进行,他们探索了z评分NF和HRV联合生物反馈对ADHD问题严重程度、HRV和呼吸参数以及定量EEG参数的影响。
其他想法包括通过分析儿童在听到他们的名字时的头部转动来检测ASD,或者在唤起快乐、愤怒或悲伤等情绪时,面部不同区域的皮肤温度。此外,阮和合著者试图将照片分为自闭症患者和非自闭症患者。在本例中,感兴趣的特征是来自于在室内或室外拍摄的人的输入照片的显著性地图。结果表明,自闭症患者拍摄的照片中包含的突出物体较少,特别是在中央视野中,两组受试者之间的区分相当成功(该模型在对人物照片进行分类时达到了81.3%的准确率)。在Zhao及其同事进行的另一项研究中,ASD儿童和对照组被要求回答10个是或否的问题。他们还被鼓励在这样做的时候点头或摇头。作者将头部在点头方向的旋转范围和每分钟在摇头方向的旋转次数作为特征输入到决策树分类器中,以92.11%的准确率区分了ASD和TD组。最后一项研究利用婴儿的超声和生物测量来预测后来的ASD诊断。当将假阳性率降到最低时,96%的TD婴儿和41%的ASD婴儿被确诊,阳性预测值为77%。
3.3 COVID-19大流行期间研究的数量和类型
图2所示。显示每年纳入的介入性和非介入性研究数量。可以观察到,尽管该系统综述仅涵盖了2019年5个月的研究,但今年的纳入出版物仅比2020年全年少8篇。在研究数量最初下降之后,2021年的研究记录增加了3.2倍(n=128)。
4. 讨论
本系统综述的目的是综合目前ndd诊断和治疗技术应用的发展趋势。这些最新成果的概述不仅可以帮助临床医生和直接与ndd患者合作的治疗师,还可以帮助研究人员决定他们未来的研究方向。尽管该综述仅涵盖了2年零7个月的研究,但仍筛选了3717份记录,纳入的出版物数量达到221份。这表明人们对利用技术支持ndd的治疗和诊断非常感兴趣。
本综述中纳入的研究非常不均衡。它们不仅涵盖了广泛的技术(如机器学习功能磁共振成像、脑电图、核磁共振成像、眼动追踪、移动应用/平板电脑、神经反馈虚拟现实、机器人、经颅磁刺激、经颅电流刺激、混合现实等),而且涵盖了各种ndd结果测量、研究设计和人群特征。此外,所调查的(生物)标志物和症状在不同的研究中有所不同。最突出的是将机器学习算法应用于脑电图、功能磁共振成像或MRI数据,特别是用于ASD和ADHI的诊断。事实上,大多数纳入的论文都涵盖了这两种情况,这在之前由Valentine及其同事进行的系统综述中也有观察到。人们对利用技术治疗自闭症个体越来越感兴趣的原因可能在于它有可能克服这一人群中常见的沟通困难。此外,它可以减轻这些个体在传统的面对面治疗中可能经历的压力或焦虑。许多研究人员也对ADHD症状的替代药物治疗感兴趣(例如,哌醋甲酯),这可能与副作用有关。神经反馈训练似乎是一个很有前途和主导的解决方案,但纳入的研究报告关于其有效性的结果不一致。例如,在Wang及其合著者的一项研究中,父母报告在脑电图神经反馈训练后孩子的ADHD症状减少。此外,干预后,参与个体的拓扑特性和流量增益与健康对照接近。另一方面,Purper-Ouakil及其同事未能证明其与哌醋甲酯相比具有非劣效性。此外,Arnold及其同事的研究并未支持有意的θ / β比神经反馈在治疗结束或13个月随访时的特定效果。
本综述所涵盖的大多数研究侧重于检测特异性NDD,而不是治疗与之相关的症状和困难。用于诊断研究的数据经常在出版物中重叠,因为它经常来自包含个人大脑结构和活动信息的相同开源数据集。不同之处在于,其处理和分析的开发算法和方法导致了不同的结果。在纳入的研究中,将机器学习算法应用于大脑数据被证明是最主要的方法。这是一种在诊断过程中克服潜在偏差的有希望的方法。其他研究的标记包括眼睛凝视特征(例如,凝视偏好模式,视觉空间工作记忆任务中的瞳孔变化),运动技能,声音特征,家庭视频中的行为特征或语言技能。可以观察到,在本综述所涵盖的大多数研究中,研究人员训练的模型可以成功区分病例和对照组,证实了NDI诊断中技术应用的巨大潜力。
使用技术检测NDD的最大优点是它可能是客观的,较少依赖于临床医生的经验或知识,并且不易出错。正如Washington及其同事(Washington, 2021)所表明的那样,基于非专业人群提取的特征的机器学习分类在使用有风险儿童的自然家庭视频进行ASD检测方面取得了高性能。
此外,在应用隐私保护机制的情况下,它保持了很高的灵敏度。这为未来的成本效益、快速和移动诊断提供了希望。当核磁共振、脑电图、眼动仪、摄像头或图形平板电脑等技术收集的数据由机器学习算法而不是人类分析时,客观性和自动化也可以实现。然而,这是有代价的。由临床医生进行的无技术行为评估由他们控制,这在本系统综述中报告的研究中并不总是可能的。在机器学习研究的一部分中,能够区分患有和未患有NDD诊断的个体的模型被训练出来,但没有识别出导致这些决策的特定标记。例如,大脑成像数据将被输入到分类器中,但病例和对照的成功分类不会用任何特定的大脑区域来解释,这些区域对算法的性能有贡献。因此,无论报告的分类准确性如何,这可能是临床医生怀疑的一个来源,因为他们不知道是什么导致了具体的诊断决定。此外,一些作者报告说,他们开发的算法能够仅根据一个标记来检测ASD,例如,听到名字时的头部转动。虽然这是自闭症检测的一个可扩展的想法,但对个体进行诊断是有责任的,应该得到充分的理解,并有足够的观察作为后盾。需要在诊断过程的自动化和简单性及其可靠性之间找到平衡。特别是,考虑到大多数研究只考虑NDD和TD人群之间的差异,忽略了在现实环境中还有许多其他可能影响所得结果的现有条件这一事实。最后,许多研究人员使用fMRI来诊断NDD,但为了获得清晰的图像,这种扫描需要保持静止,这在感兴趣的人群中可能是具有挑战性的。根据Yerys及其合著者的一项研究,在ASD和ADHD人群中获得的可解释数据比在TD人群中获得的数据少。
在工艺处理方面,取得了良好的效果。纳入的研究针对广泛的症状,如注意力不集中、多动症、执行功能、工作记忆、运动技能和行为问题,情绪识别和理解,焦虑,以及ASD的社交和沟通缺陷,阅读障碍的阅读技能、视觉空间注意力和言语工作记忆,DCD的运动技能,智力残疾的言语可理解性和视觉-运动整合,抽动症的抽动,或雷特综合症中刻板印象的强度。本综述涵盖的大多数基于技术的干预措施在目标症状上取得了显著改善。此外,以虚拟现实游戏或社交机器人的形式引入的治疗,特别是为儿童和青少年设计的治疗,可能对感兴趣的人群更具吸引力,并且可能在干预期间导致更多的参与,这对其有效性至关重要。在NDD人群中使用技术的另一个优势是它有可能提供无副作用的家庭治疗。例如,可以在任何地方访问的平板电脑游戏形式的干预可能是一种有趣、廉价和有效的方法,可以改善个人的功能并增加治疗的可及性。然而,并非所有纳入的研究都使用了廉价且易于获取的技术。例如,功能磁共振成像的使用相对昂贵,目前在一些地区使用它受到限制。因此,利用该技术的报道研究并不一定能提高ndd治疗或诊断的可及性。可以注意到,在纳入的研究中常用的技术不一定是创新的,并且已经可用了一段时间,例如,脑电图首次记录于1924年,功能磁共振成像自1990年以来已被广泛应用于数千项研究中,而非常常用的机器学习分类器即支持向量机的想法早在1964年就已发表。
有用性和成功应用取决于许多因素,例如收集数据的条件(例如,在静息状态下,或在特定任务期间),数据预处理方法,或目标人群的年龄及其其他特征。例如,经颅直流电刺激可以增强脑瘫儿童的运动学习,但对8-12岁DCD儿童的运动功能没有积极影响。此外,在使用具有卡通面部表情的机器人和平板电脑进行干预后,6-12岁的ASD儿童的意识、认知、沟通、社交动机和自闭症行为并没有改善,但在4-6岁的ASD儿童中使用社交机器人时,发现联合注意力启动和功能性游戏行为有显著改善。在使用相同技术(如功能磁共振成像或脑电图)的诊断研究中也可以观察到类似的变化,但得到的结果不同。
从研究的角度来看,纳入的研究中提出的大多数方法仍需要更多的证据才能纳入卫生系统。这些研究应该在更大、更有代表性的群体中进行重复和测试。有必要纳入更多的女性参与者、患有ndd的成年人以及患有常见合并症的个体。此外,纳入方案的多样性使得很难进行可能导致更直接的临床意义的荟萃分析。因此,为了能够对某一特定技术的疗效得出结论,提高结果的可解释性,需要进行大量类似方案的研究。从临床角度来看,利用技术进行更快、更便宜、更客观的诊断,或有趣、吸引人、无副作用的治疗是诱人的,可能有助于专业人员的临床实践,但在进行更多研究之前,应谨慎对待。针对ndd相关症状和困难的几种循证干预措施已经存在,与新技术相比,其有效性的证据要有力得多。然而,由于社交机器人、平板电脑以及其他引进的技术被认为是安全的,在最坏的情况下,它们只是无效或令人不快(例如,经颅磁刺激),它们可能会被潜在地添加到现有的标准中。此外,在诊断过程中引入机器学习可以作为临床医生的帮助或辅助,但远远不能取代他们。这不仅是因为许多研究的质量差,使得结果不那么可信,而且还因为研究人员经常没有提供现成的诊断系统,这些系统实际上可以展示给专家并供他们使用。为了调查技术对用户和家庭的真正影响,研究应该开始从实验室转向临床环境和现实环境。从成本和纳入临床方案的可能性的角度调查所提出的技术的实际使用的研究仍然需要进行。应进一步探讨为家庭和/或卫生系统节省的潜在费用。此外,所提出的技术的可接受性需要从其潜在用户的角度进行调查,这在所包括的研究中经常被遗漏。
在本综述中可以观察到的是,从2020年开始纳入的研究数量较少(n= 40),这可能是由于CoVID-19大流行中断了许多研究人员的数据收集。然而,在最初的调整期之后,科学家们经常不得不重新组织他们的工作,在2021年可以观察到新发表的研究的高峰(n= 128)。这可能是由于世界各地的封锁和研究人员花更多时间写论文而不是收集数据的结果。鉴于面对面互动的限制,开源数据集如ABIDE或ADHD-200被广泛使用也就不足为奇了。将机器学习算法应用于现有数据使科学家能够开发ASD和ADHD检测的自动诊断模型。
5. 结论
目前的系统综述提供了一幅在NDD诊断和治疗中迅速推广使用技术的图景。它介绍了2019年至2022年期间发表的大量干预性和观察性研究的结果,显示了对该领域的极大研究兴趣。据我们所知,这是该领域最新的系统综述。尽管基于这一综述很难得出关于NDD评估或治疗的特定技术的功效和效用的结论,但许多科学家提出了值得进一步探索的有希望的结果。所提出的方法可能成为未来临床实践的一部分,并为进一步的研究提供灵感。
参考文献:Technologies to support the diagnosis and/or treatment of neurodevelopmental disorders: A systematic review☆ .