摘要:人工智能 (AI) 正在迅速改变医疗保健,其在癫痫领域的应用在过去十年中呈指数级增长。将 AI 整合到癫痫管理中有望彻底改变该复杂疾病的诊断和治疗。然而,将 AI 转换为神经学临床实践尚未取得成功,这强调了需要考虑迄今为止的进展并评估 AI 的挑战和局限性。在这篇综述中,我们概述了使用各种数据模式开发的癫痫 AI 应用:神经影像、脑电图、电子健康记录、医疗设备和多模态数据整合。对于每种模式,我们都考虑了潜在的用途,包括癫痫发作检测和预测、癫痫发作定位、癫痫起始区定位以及对手术或神经刺激干预的评估,并回顾了迄今为止开发的 AI 工具的性能。我们还讨论了必须解决的方法论考虑因素和挑战,以成功地将 AI 整合到临床实践中。我们的目标是概述该领域的当前状态,并为未来利用 AI 改善癫痫管理提供指导。
1. 引言
人工智能 (AI) 正在迅速改变医疗保健领域,其在癫痫领域的应用在过去十年中呈指数级增长。将AI 集成到癫痫管理中有望彻底改变这种复杂疾病的诊断和治疗。然而,将 AI 转化为神经学临床实践尚未取得成功,这强调了需要考虑迄今为止取得的进展并评估 AI 的挑战和局限性。在这篇综述中,我们概述了使用各种数据模式开发的癫痫 AI 应用:神经影像、脑电图、电子健康记录、医疗设备和多模态数据集成。对于每种模式,我们考虑了潜在的用途,包括癫痫发作的检测和预测、癫痫发作的定位、癫痫发作起始区 (SOZ) 的定位以及对手术或神经刺激干预的评估,并回顾了迄今为止开发的 AI 工具的性能。我们还讨论了必须解决的方法论考虑因素和挑战,以成功地将 AI 集成到临床实践中。我们的目标是概述该领域的当前状态,并为未来利用 AI 改善癫痫管理提供指导。
患有癫痫的人通过医疗保健系统的过程会产生大量关于其疾病的信息。在第一次就诊时,患者的病史会进入电子病历中,他们可能会进行头皮脑电图 (EEG) 和脑部 MRI,以评估电生理和结构脑异常。在评估初步结果后,该个体很可能会接受抗癫痫药物试验。对于三分之二患有癫痫的人来说,他们的状况会对抗癫痫药物产生反应,但三分之一的人会继续出现无法控制的发作1。对于这些个体,手术或神经调节方法是实现癫痫发作自由的主要途径,这些方法需要大量评估才能确定癫痫发作起源的脑区,即癫痫发作起始区 (SOZ)。这个过程包括在癫痫监测单元进行的 I 期评估,在该评估期间,在控制环境中撤药,并使用头皮 EEG 和视频监测来检测和定位癫痫发作。在这个阶段,还可能进行高级神经影像学检查,如正电子发射断层扫描 (PET) 和基于任务的功能性磁共振成像 (fMRI)。获得关于癫痫发作侧化和大致定位的信息后,这些信息可以用于 II 期评估,即颅内脑电图 (iEEG),在该评估中,在可疑的 SOZ 中植入电极,并重复 I 期中使用的方法。iEEG 数据提供了最终证据,用于确定手术方案,例如消融、切除或植入神经调节装置。
这个旅程的每个阶段以及每个工具的使用(图 1)都会生成数据,AI 可以利用这些数据。然而,有效地将 AI 工具转化为临床实践需要医生了解 AI 的基本概念(图 2)、正在开发中的工具以及它们的使用方式。在这篇综述中,我们提供了关于 AI 在癫痫中当前发展的全面概述,这对于将这些工具有效转化为临床实践至关重要。我们介绍了机器学习和深度学习方法,这些方法结合了癫痫患者医疗保健旅程中使用的每个工具的数据,从电子病历到 iEEG 和神经影像。大多数此类应用专注于单个模态,但尽可能多地描述了跨模态信息结合的方法。此外,虽然我们描述了涉及目前用于临床实践的工具的应用(例如,结构 MRI、PET 和 iEEG),但我们还描述了涉及目前尚未在临床中使用但有可能在集成时提供帮助的模态的应用(例如,弥散加权成像、静息态 fMRI 和可穿戴设备)。最后,我们描述了解决方案,以解决必须解决的某些最大局限性,以成功地将 AI 集成到癫痫的临床管理中。我们的目标是概述该领域的当前状态,并为未来利用 AI 改善癫痫管理提供指导。
图1 主要用于癫痫中的 AI 数据模态。
图2 人工智能术语概述。
2. 神经影像
多模态成像在癫痫管理的整个疾病轨迹中发挥着关键作用,从初始诊断到难治性癫痫的术前评估。在术前评估中,结构和功能成像对于定位致痫区至关重要,并有助于移除、切除或神经调节。鉴于其临床效用,神经影像自然成为众多癫痫 AI 研究的焦点。在本节中,我们将回顾神经影像中 AI 应用的当前状态。
2.1 结构神经影像
结构神经影像,特别是结构 MRI,包括 T1 加权成像、T2 加权成像和液体衰减反转恢复 (FLAIR) 成像,是癫痫患者术前评估中最常见的神经影像学方法。这些方法可以直接可视化潜在的癫痫病因的结构异常,例如局灶性皮质发育不良 (FCD)、海马萎缩或脑肿瘤。结构 MRI 对临床管理的直接影响使其成为基于 AI 的病变检测算法的明确候选者。
大多数针对癫痫病变检测的 AI 研究都集中在 FCD 的检测上,因为这种病变是颞叶外癫痫中最常见的,适当的手术治疗通常可以实现无发作。早期方法包括使用线性判别分析分类器和逻辑回归分类器从 T1 加权图像中检测皮质形态特征,以识别在组织学上为阳性但在 MRI 上为阴性的人;也就是说,脑 MRI 没有发现可见的结构异常。检测 FCD 的其他方法涉及使用灰-白质交界处的图像强度特征和来自自动编码器创建的高维特征,这些特征在监督学习和非监督学习范例中使用支持向量分类器进行分析。使用这些方法,MRI 阳性人群的 FCD 敏感性为100%,非监督学习方法提高了 MRI 阴性但组织学上为FCD 阳性人群的敏感性。基于规范建模的皮质异常检测方法也已开发,在 MRI 阳性和 MRI 阴性 FCD II 型人群的混合队列中实现了 0.96 的 AUC 值。
这些研究集中在成人群体,其中 FCD 在癫痫患者中的比例比儿童群体中要小。使用单层神经网络分析图像强度(来自FLAIR 和 T1 加权图像)和皮质形态特征,在儿童群体中检测 FCD 的敏感性为 73%。这项研究中确定的特征成为其他 FCD 检测研究的基石,并最终导致了多中心癫痫病变检测项目的创建,这是一个国际合作项目,它测试、验证和细化了原始 FCD 检测算法,涉及数百名参与者和机构。在基于多中心数据集的另项工作中,开发了一种双卷积神经网络方法,其中直接从 T1 加权图像和 FLAIR 图像中提取3D 图像块,消除了需要特征制作的需求,经过 leave-one-site-out 交叉验证后,敏感性达到 93%。
这些国际、多机构合作是确保癫痫管理中 AI 算法可推广性的努力的好例子,取得的进展使得 FCD 检测算法有望在接下来的 5-10 年内被纳入临床应用。
AI 也可以通过检测结构异常来帮助诊断癫痫。这种方法最常用于颞叶癫痫 (TLE),在这种疾病中,海马体等中线颞叶结构中的结构改变有助于将癫痫患者与健康对照组区分开来。使用支持向量分类器进行区域体积测量或从海马体分割中提取形状和放射组学特征,可以实现 TLE 和健康对照组的分类,其受试者工作特征曲线下面积 (AUC) 大于 0.8。此外,使用结合海马体体积和基于强度的特征的支持向量分类器,在 MRI 阴性人群中实现了 96% 的病变检测率。
基于图像分类的卷积神经网络也被用于从 2D 冠状灰质图中检测 TLE。在这种方法中,冠状成像切片被用作卷积神经网络的直接输入,最小化了特征选择的必要性。在一个 MRI 阳性或 MRI 阴性 TLE 的人群中,卷积神经网络实现了 0.87 的 AUC。类似地,使用轴向灰质图训练卷积神经网络以区分 TLE、阿尔茨海默病和健康对照组,即使一半的队列 MRI 阴性 TLE,也实现了 91% 的检测率。
类似的策略也用于 MRI 阴性癫痫患者的 SOZ 定位。在这个背景下,使用支持向量分类器分析海马体体积测量和 FLAIR 强度数据,可以实现 82% 的定位精度,而使用仅包含 MRI 阴性 TLE 中颞叶结构的FLAIR 强度数据支持向量分类器,可以实现 76% 的定位精度。此外,使用仅包含结构脑体积数据和支持向量分类器的算法,当使用光谱聚类进行特征选择时,在 MRI 阴性癫痫患者中实现了 94% 的定位精度。
其他模型也被用于以高精度进行定位。例如,使用随机森林分类器对强度和结构特征进行分类,在 MRI 阴性癫痫患者中实现了 AUC 为 0.84 的定位,而使用结合杏仁核、丘脑和海马体体积的逻辑回归分类器,实现了 92% 的定位精度。
这些研究的局限性在于,所使用的算法是在单一队列中开发和测试的。在另项研究中,使用线性判别分析分类器,该分类器整合了来自海马体成像的形态学和强度测量,并在多中心队列中进行验证,实现了 AUC 大于 0.94。最后,AI 被用于改善海马硬化症的诊断。基于图谱的算法的海马体分割已被证明可以成功地检测海马硬化症,而深度学习的分割提高了分割过程的效率和准确性。
AI 和结构 MRI 也被用于区分癫痫亚型。使用皮质和亚皮质形态学和强度特征组合的支持向量分类器,可以实现有病变和无病变 TLE 的区分,准确率为 81%。类似地,使用以 T2 加权图像作为输入的 3D 卷积神经网络,可以实现有病变和无病变 TLE 的区分,准确率为 89%。
对于 TLE 的亚型,分析海马体、杏仁核和扣带回皮层的表面形态特征,并结合无监督K-means 聚类,确定了四种主要的萎缩模式和一种肥大模式,从而定义了四种 TLE 亚型。类似地,FCD 的自动亚型化也得到了探索。例如,支持向量分类器分析皮质厚度和折叠复杂性,以98% 的准确率区分了 FCD I 型和 FCD II 型。在其他研究中,海马体体积和 T1 加权图像和 FLAIR 图像中的皮质特征,使用逻辑回归分类器将 FCD IIIa 型和 FCD I 型患者彼此区分开来,并与健康对照组区分开来,准确率为 34%,而使用基于随机森林的特征选择的 T1 加权图像和 FLAIR 皮质特征的无监督聚类分析,确定了 FCD II 型的四种亚型。
将 AI 应用于结构 MRI 有助于规划癫痫的手术治疗。基于深度学习的分割工具,例如 ANTsPyNet 和 FastSurfer,提供快速准确的脑组织分割,从而简化了术前立体脑电图电极定位,并有助于在紧张的手术时间内有效地放置电极。基于深度学习的 FCD 检测也被用于确定术前评估期间放置的颅内电极是否与皮质病变重叠。对于激光间质热疗计划,随机森林分类器和线性回归分类器被用于估计最佳手术路径,以避开关键脑结构。手术后,了解切除腔的大小和位置是了解哪些脑区被移除所必需的,卷积神经网络已被开发来有效地分割这些腔隙。自监督学习和半监督学习方法,两者都减少了需要完全注释数据集的需求,已被用于解决传统卷积网络需要大量数据才能实现可接受性能的事实。
2.2 PET
间期 PET,尤其是 18F-氟代脱氧葡萄糖(FDG) PET,在临床用于检测与致痫性相关的低代谢脑区。定性解释是临床标准,但 AI 可以帮助解释间期 FDG PET,以促进 SOZ 的定位和定域。
在早期工作中,使用支持向量分类器自动量化脑区之间的 FDG PET 对比度,用于 TLE 的诊断和定位,其准确性与专家神经放射科医生进行的定性分析相当。随后,使用逐体素方法,其中每个 FDG PET 脑体素是支持向量分类器中的一个特征,实现了与 MRI 阴性人群中人类标注的缺氧代谢近完美的符合,准确率为 82%。进一步地,使用卷积神经网络自动定位 TLE 儿童的 PET 图像中的 SOZ,实现了高代谢和低代谢区域的定位,AUC 为 0.93。
还尝试使用 AI 基于 FDG PET 数据预测手术治疗结果。在一项研究中,将区域不对称性与临床变量结合在一个随机森林分类器中,以 71% 的准确率预测了不良的治疗结果,优于该算法中仅使用临床变量时的准确率。在另一项研究中,提供给随机森林分类器的特征包括手术切除区域内 (相对于健康对照组,根据术后结构成像估计) 的 FDG PET 缺氧代谢和其他 FDG PET、结构 MRI 和临床变量,这种方法在预测手术治疗结果方面实现了 80% 的准确率。
帮助提高神经影像质量的深度学习算法越来越受欢迎。类似的方案已应用于通过深度学习图像转换增强 FDG PET 图像。这种增强可能有助于检测癫痫病变,但需要进一步验证该方法。
2.3 功能 MRI
任务 fMRI 在临床用于定位癫痫患者中的语言网络,这些患者是手术候选人。机器学习算法已被用于促进这一过程。在一项研究中,使用一个经过语言 fMRI 定位指数、临床和神经心理学数据训练的半监督逻辑回归分类器,可以实现左、右和双侧语言优势的分类,准确率为 89%。在另一项研究中,使用语言任务激活图和神经生理数据在一个极端梯度提升算法中,可以将癫痫患者与健康对照组区分开来,AUC 为 0.91。
癫痫是一种网络疾病,静息态 fMRI 有助于了解癫痫发生的基础功能网络破坏,尽管这种成像技术目前尚未用于临床。AI算法的发展集中于简化静息态 fMRI 数据的分析,这种数据由于其三个空间维度和时间维度,本质上具有高维性,并将其应用于可能与癫痫发生相关的功能信号,以进行分类和定位癫痫。使用静息态 fMRI 数据区分癫痫患者与健康对照组,最广泛使用的算法是支持向量分类器。已使用多种特征进行分析:通过独立成分分析获得的静息态大脑网络;血氧水平依赖 (BOLD) 信号的低频波动幅度和区域异质性;全脑功能连接和图论度量。然而,在一项研究中,使用 3D,z 分数的 BOLD 延迟图(来自每个体素与滞后全局脑信号的协方差最大值)与 3D 卷积神经网络一起使用,以区分癫痫儿童与健康对照组,准确率超过 90%,尽管许多研究包括的样本量很小。在样本量较大的研究中,报告的准确率通常较低,但更具有代表性。
使用静息态 fMRI 数据进行 SOZ 定位也得到了探索。在此背景下,使用图论度量作为二次判别分析分类器中的特征;在随机森林基于的特征选择之后,使用功能连接度、图论度量、低频波动幅度和区域异质性在支持向量分类器中使用;以及在随机森林基于的特征选择之后,使用动态功能连接度图论度量作为支持向量分类器中的特征。
SOZ 定位比仅仅定位更具有挑战性,以前曾尝试使用独立成分分析,这是一种识别具有相似脑活动脑区的过程,和支持向量分类器,但一种新颖的方法是使用图卷积神经网络。在这项研究中,使用扩散 MRI 获取的结构连接性在应用卷积运算到全脑静息态 fMRI 连接性数据之前约束底层图。这种方法通过图结构利用底层结构连接性特征,尽管性能平平 (AUC 0.73) 且样本量较小,但它为开发其他用于研究癫痫中功能和结构连接体的图卷积神经网络算法提供了基础。
最后,静息态 fMRI 和机器学习已被用于预测药物反应和手术治疗结果。方法包括使用丘脑枢纽度(图论度量)的功能连接度,与支持向量分类器一起预测 TLE 术后无发作;以及使用度中心性(另一种图论度量),与支持向量分类器一起预测儿童癫痫的抗癫痫药物治疗反应。在一项研究中,使用全脑功能连接度指标和随机森林预测创伤后癫痫的发展。
2.4 扩散成像
扩散张量成像 (DTI) 提供了研究致痫脑网络中白质通路(即结构连接性)的机会。该技术目前尚未用于临床,但结合 AI,DTI 有助于诊断、定位癫痫。
与用于区分癫痫患者与健康对照组的静息态 fMRI 研究一样,支持向量分类器主要用于 DTI 的分类。在这些研究中使用的特征包括:从 DTI 获取的指标的三维图;分数各向异性均值扩散性和平均曲率;结构连接体。在一项研究中,支持向量分类器与一个预训练的卷积神经网络结合,用于从海马体分数各向异性、平均扩散性和平均曲率的图中提取特征。支持向量分类器也是使用 DTI 数据进行癫痫定位的首选模型;在此背景下,分数各向异性图和结构连接体图论度量是主要特征。在这些研究中,癫痫患者与健康对照组的区分准确率超过 90%,尽管样本量很小(20-59 名癫痫患者和 14-70 名健康对照组)。
许多研究 DTI 的癫痫研究都集中于使用结构连接体中的异常来预测癫痫手术后的结果。AI 处理连接体中高维数据的潜力为无创预测手术治疗结果提供了可能性。该领域的开创性工作涉及使用全脑结构连接体、弹性网络回归进行特征选择和支持向量分类器来预测手术治疗结果,并在内部验证和外部验证后实现了 70% 的准确率。在扩展此方法的后续工作中,使用图论度量比较了手术前测量的连接体与估计的手术后连接体,结果在预测癫痫结果方面实现了 79% 的准确率。在类似的方法中,与癫痫患者相比,与健康对照组在手术前和手术后幸存连接体中计算的节点异常(即所谓的节点异常)与临床变量相结合,使用支持向量分类器,可以实现 AUC 为 0.84 的良好和不良癫痫结果预测。在进一步的研究中,深度学习被用于最小化特征选择的需求;整个连接性矩阵被输入到神经网络中进行结果预测,导致 88% 的阳性预测值和 79% 的阴性预测值。在随后的多中心研究中,从结构连接体中派生出的图论度量(例如,介数中心性)用于训练神经网络,在外部验证后实现了 0.88 的 AUC 来预测手术治疗结果。在考虑基于连接体研究(结构和功能)的结果时,需要注意的是,不同研究中使用不同的脑图谱可能会影响结果(详细回顾见 elsewhere)。
除了癫痫手术治疗结果,DTI 还被用于帮助预测癫痫患者手术前后语言障碍。对于手术前的语言表现预测,结构连接体中派生出的图论度量与支持向量回归器结合,以及使用 2D 卷积神经网络应用于结构连接体。这两种方法都与临床定义的手术前语言表现高度相关(r > 0.8)。对于预测手术后语言下降,比较手术前测量的连接体与估计的手术后连接体,结果在预测图片命名任务结果下降方面实现了 AUC 为 0.84。在另一种方法中,卷积神经网络被用于根据来自电刺激映射的地面实况标签将轨迹分类为属于不同的优势区域(例如,运动、语言或视觉)。将此卷积神经网络应用于手术前和手术后的 DTI 数据来估计语言轨迹体积的差异,结果表明这些差异与手术后语言障碍高度相关。
2.5 多模态神经影像
多模态成像使 AI 算法能够结合每个模态的特征,并利用单个模型中多种成像技术的优势。神经影像研究通常是固有多模态的(例如,静息态 fMRI 和 DTI 预处理管道通常涉及使用 T1 加权图像),但以下描述的研究涉及在最终模型中使用每个模态的特征。
与单个成像模态一样,多模态成像方法已被用于区分癫痫患者与健康对照组。这类早期工作中的一种方法是将 T1 加权图像和 T2 加权图像与来自DTI 的分数各向异性均值扩散性一起使用。分析显示,与支持向量分类器一起使用的 T1 加权图像特征在区分 TLE 患者与健康对照组方面最为有效,准确率为 89%。将 DTI 和静息态 fMRI 的结构和功能连接体在多层网络中结合,确定了这些网络之间一致的连接模式,然后使用支持向量分类器用于区分 TLE 患者与健康对照组(准确率为 83%)和额叶癫痫患者(准确率为 84%)。在另一项研究中,从静息态 fMRI 中派生的低频波动幅度和区域异质性以及 T1 加权图像中的结构图(包括灰质、白质和皮质厚度)的结构图被结合起来,一个结合了这些数据中结构和功能特征的支持向量分类器将左 TLE 患者与健康对照组区分开来,准确率为 84%。最后,将 FDG PET、DTI 分数各向异性和皮质厚度不对称性结合在一个逻辑回归模型中用于 TLE 定位,结果表明,添加更多的不对称性并没有超过仅使用 FDG PET 不对称性所实现的性能。
目前用于分类和定位癫痫的多模态研究并不优于单模态方法。造成这种情况的一个原因可能是多个模态提供的信息不是互补的,而是冗余的,因此跨模态组合特征时很难获得新的信息。另一个原因是多模态数据最有可能用于具有更复杂疾病的患者,这意味着样本量较小,临床特征化更困难。ENIGMA-Epilepsy 工作组所做的工作部分解决了这些担忧,该工作组从超过2000 名癫痫患者中收集了结构和扩散数据。早期工作没有充分利用其多模态性质,但在这大群体中单独探索结构和扩散数据已经提供了 AI 算法用于分类和定位癫痫的性能的 realistic 估计。比较 ENIGMA-Epilepsy 数据集中每个脑区计算的特征计算的支持向量分类器和神经网络,结果表明,旨在检测 TLE 的模型在扩散数据方面具有可比或优于旨在确定 TLE 方向的模型(68-75%)的性能,但当使用结构数据时,性能反转。
对于手术结果预测的多模态方法,术后切除掩模(来自术后 T1 加权图像)已被用于在术前 CT、FDG PET 和 T1 加权图像中绘制感兴趣区域。围绕该体积的FDG PET、T1 加权图像和 CT 区域兴趣被提取并用作输入,以供预训练的深度残差神经网络进行特征提取,这种多模态深度学习方法与支持向量分类器结合,以预测手术治疗结果,准确率超过 90%。尽管令人鼓舞,但这种方法需要在其他数据集中进行复制,以评估其泛化能力。
最后,多模态无监督癫痫亚型分类也已被探索。使用皮质和海马体结构和扩散异常作为特征,潜态狄利克雷分配——一种无监督主题建模算法——已被用于识别患者和脑区之间异常的模式。这种方法在患者中确定了四种主要疾病因素。使用类似的算法和 7T T1 加权体积测量,也实现了 TLE 中丘脑和海马体萎缩模式的识别。
3. 颅内脑电图
iEEG是一种侵入性测试,通常在非侵入性程序(包括头皮 EEG、癫痫发作学、神经心理学测试和多模态全脑成像)结果不明确或不一致时进行。iEEG使医生能够更精确地定位发作灶,以指导针对特定患者的最佳治疗方案的临床决策,无论是切除、激光消融还是神经调节。关于 EEG 数据与 AI 的使用的讨论通常将头皮 EEG 和 iEEG 一起考虑,但这两种模态非常不同。iEEG 更具特异性,因为测量是在脑组织中直接进行的,提供了比头皮 EEG 更清洁和更精确的测量。这种更高的数据质量使 iEEG 对 AI 应用具有优势,因为它更容易识别复杂的生理和病理模式,有助于癫痫的诊断和管理。因此,鉴于 iEEG 在癫痫术前管理中的直接影响,我们专注于这种模态,而不是之前已进行回顾的头皮EEG。
AI 用于解释和处理 iEEG 数据最常见的应用包括发作检测和预测、SOZ 定位和 ictogenic 模式检测(图 3)。
图3 用于解释颅内脑电图数据的 AI 应用。
3.1 发作检测和预测
发作检测和预测是 AI 分析 iEEG 数据最常见应用。发作检测算法的目的是在发作开始时尽快提供警报,而发作预测算法旨在预测发作何时发生。两者都具有很高的临床价值,因为发作检测可以帮助定位发作的开始,而发作预测可以定位和预防性进行药物治疗或神经刺激干预。
公开访问的数据集促进了发作检测和预测算法的开发,因为这些数据集中的数据对于模型训练和测试是可访问的。此类数据集的早期例子包括弗莱堡医院 EEG 数据库和伯尔尼-巴塞罗那EEG 数据库,其中一些数据集也包含在更大的 EPILEPSIAE 数据库中。其他数据集已被明确公开,目的是众包发作检测和预测算法;此类数据集包括美国癫痫学会发作预测挑战、墨尔本大学 AES/MathWorks/NIH 发作预测挑战和宾夕法尼亚大学和梅奥诊所的发作检测挑战。更普遍的是,IEEG.org 和 OpenNeuro 作为公开访问的 iEEG 数据集存储库。
3.1.1 发作预测
在一项早期使用机器学习进行基于 iEEG 的发作预测的研究中,评估了逻辑回归、支持向量分类器和卷积神经网络分类器,并使用时间域和频率域的单变量和双变量特征。在这项研究中,至少一种分类器为每位参与者预测了所有发作;发作的平均检测时间为发作开始前 60 分钟,使用卷积神经网络的结果没有误报率。在随后的研究中,使用手动选择的频谱特征(例如,带功率)的支持向量分类器以及/或更复杂的特征选择(例如,递归特征消除),两者的误报率均低于每小时 0.3,灵敏度接近 100%。此外,将样本熵(一种衡量信号复杂度的指标)作为一层神经网络中的特征,提供了一种计算量更低的替代方案,用于替代计算密集型多维支持向量分类器。这些研究都使用了弗莱堡医院 EEG 数据库。
然而,这些早期研究的一个局限性是 iEEG 记录是在癫痫监测单元的术前评估期间获得的,因此持续时间较短。美国癫痫学会发作预测挑战在一定程度上缓解了这一限制,因为它提供了来自两名人和五条狗的长期记录。在这个挑战中,要求开发一个算法,该算法可以根据提供的数据集最好地预测发作。为挑战开发的算法在保留数据集上的平均 AUC 为 0.74;排名前六的算法中,都使用了某种形式的频谱功率,并结合了时间和/或频谱双变量特征。最常用的模型类型是支持向量分类器,要么单独使用,要么与其他模型一起作为集成的一部分。
手动选择特征(例如,带功率和熵)会阻碍模型的泛化,因为对于某个数据集来说最理想的特征可能对于另一个数据集来说并不是最佳的。这促使采用了深度学习方法进行发作预测。在一项研究中,iEEG 时段被转换为 2D 光谱图,可以直接输入到卷积神经网络中,在三个数据集上的灵敏度为 75-82%。同样,使用 iEEG 光谱图和卷积神经网络进行发作预测,在低功耗神经形态芯片上实现,这种芯片设计得更像人脑而不是传统的计算机处理器,灵敏度为 69%,为可穿戴设备的实现提供了一个概念证明。类似的基于光谱图的方法也被用于 FCD 中的发作预测,但性能因人而异,采样率和包含记录的长度而异。这种趋势在测试各种卷积神经网络架构以将原始 iEEG 数据作为输入时继续,这导致在两个长期 iEEG 数据集上实现了相似的性能,这表明具有良好的泛化。在另一个为发作预测开发的卷积神经网络中,原始 iEEG 数据被用作输入,使用积分梯度自动提取光谱特征,从而创建了一个数据驱动的致痫性指数。
最近开发的发作预测算法几乎完全基于深度学习。其中一个算法使用弗莱堡数据集对具有双变量频谱特征的卷积神经网络进行训练和测试,其性能与以前使用该数据集的更简单机器学习和特征工程方法相当。同样,在 AES 发作预测挑战数据集上进行发作预测时,使用双向编码器表示从转换器——一种流行的基于转换器的自然语言处理架构——其性能与以前使用的算法相当。尽管深度学习方法预测发作方面有所创新,但与更简单的机器学习和特征工程方法相比,性能改进并不显著。这种性能增长停滞可能是由于目前可用的数据集固有的限制。样本量有限、数据质量变化和临床标签不一致等因素可能构成挑战。因此,在所有情况下,深度学习优于其他方法的优越性并不是理所当然的,因为需要更高质量、更大和更好标注的数据集才能继续取得进展。
3.1.2 发作检测
基于机器学习和深度学习的发作检测方法在其他地方进行了详细回顾。这里,我们专注于使用 iEEG 数据的方法,并突出文献中的趋势。在本节讨论的所有研究中,发作检测的准确率、灵敏度和特异性均超过 90%。
早期使用深度学习进行发作检测的工作使用了突触神经网络,其准确率超过 90%。比较多层感知器(简单的神经网络)和支持向量分类器进行发作检测,发现后者表现更好。在随后的研究中,主要使用传统的机器学习分类器,特别是支持向量分类器,这可能是由于它们的简单性、效率和有效性。最近的支持向量分类器实现侧重于提高其能源效率,以便与植入式设备一起使用,以及开发实时自适应实现,允许在获得新数据时将其纳入训练集。
在大多数这些研究中,数据来自公开可用的数据集,例如弗莱堡数据集和波恩大学数据集,或者用于数据收集的时间限制在癫痫监测单元住院期间的自家数据。为了解决记录持续时间有限和采样有限的问题,宾夕法尼亚大学和梅奥诊所的发作检测挑战被启动;提供了来自四条狗和八名癫痫患者的长期记录以及来自八名癫痫患者的预手术评估数据。作为次要验证数据集,包括七名患者的预手术评估和来自 NeuroVista 响应神经刺激设备的 11 条长期记录,用于评估模型泛化。在竞争和验证数据集上,排名前三的算法都由集成方法组成:随机森林分类器、多层感知器的集成和决策树的集成。所有三种方法在竞争和验证数据集上的发作检测准确率均超过 97%。
至于发作预测,发作检测方法转向那些需要很少或不需要特征选择的方法,即直接将卷积神经网络应用于原始 iEEG 信号,但性能改善的结果是喜忧参半。在一项研究中,将卷积神经网络应用于原始时间iEEG 信号,导致良好的性能,但与特征丰富的方法(例如随机森林分类器和支持向量分类器)相比,准确率、特异性和灵敏度均较低。使用类似卷积神经网络设置,显示对光谱信号进行最小的预处理(快速傅里叶变换)相对于使用原始时间信号提高了性能。将时间 EEG 信号转换为“图像”并通过卷积神经网络进行发作检测的创新转换,成功地通过迁移学习将网络训练从头皮 EEG 数据扩展到 iEEG 数据,尽管精度和误报率存在问题。比较卷积神经网络与结合头皮 EEG 数据和 iEEG 数据的长期短期记忆递归神经网络,以及使用双变量时间特征,表明卷积神经网络提供了最高的准确率(>98%)和最低的误报率(<1%)。
尽管深度学习仍然是一个有吸引力的选择,但最新工作已经后退一步,专注于开发高效且可解释的算法和特征,这些算法和特征可以用于实时发作检测系统。例如,在一项研究中,手工挑选的频谱特征与随机森林和神经网络特征提取结合,以选择下游发作检测的可解释特征。另一个例子是称为近似零交叉的特征,该特征旨在复制神经学家从噪声数据中选择突出模式的方式,已被证明不仅高度可解释且计算量小,而且对发作检测有效,优于其他 57 个常用特征。
3.2 发作特征
AI 可以用于识别可以用 iEEG 测量的发作特性,包括它们的严重程度和传播模式。在一项比较机器学习和深度学习算法测量发作传播模式的比较中,发现患者在传播模式中存在一个常见的分层组织。在此基础上,非负矩阵分解已被用于无监督机器学习来识别数据驱动的发作传播、持续时间和症状的权重,从而开发了一个发作严重程度评分,该评分根据其电临床特性将发作进行分组。
3.2.1 发作起始区定位
SOZ 定位是癫痫患者术前评估最重要的结果,因为准确识别发作开始的大脑区域对于成功进行手术或神经刺激干预至关重要。然而,iEEG 中的 SOZ 定位仍然是一个挑战。AI 正在被应用于这个特定任务,目的是最大限度地减少需要诱发的发作,并减少在癫痫监测单元的住院时间。然而,与这项任务相关的挑战意味着 SOZ 定位的准确性通常低于发作预测和检测,通常在 70-85% 范围内。这种限制可能是由于 AI 模型的准确性不准确,或者是我们对 SOZ 的生物学模型的准确性不准确(例如,分布式癫痫网络假说148)。尝试使用 AI 进行 SOZ 定位的工作主要涉及使用传统的机器学习(特别是支持向量分类器),而不是深度学习,这可能是由于可用数据的稀疏性。
最初,通常用于发作预测的公开可用的数据集被改编用于 SOZ 定位的研究。例如,在一篇 2017 年发表的论文中,支持向量分类器被用于使用来自弗莱堡和波恩数据集的间歇期 iEEG 数据的频率域特征,分别在这两个数据集上达到 83% 和 88% 的准确率。在随后的研究中,收集了新的数据,但对 iEEG 数据应用了类似的频率域转换,然后进行边缘特征提取并使用支持向量分类器,结果在识别 SOZ 的阳性预测值为 >90%,误报率为 0.7%,准确率为 720。
在其他研究中,使用了间歇期 iEEG 记录的短片段进行 SOZ 定位,因为临床使用此类数据将最大限度地减少在癫痫监测单元的住院时间。例如,在一项研究中,2 小时间歇期数据中的间歇期癫痫样放电、高频振荡和相位振幅耦合的发生率被用作支持向量分类器的特征。这种方法的交叉验证 AUC 为 0.73,表明,尽管准确性有限,使用最少的间歇期数据(2 小时)就可以实现 SOZ 的识别。此外,使用 30 分钟的间歇期数据提取单变量和双变量频谱和时间特征以及高频振荡率,支持向量分类器的SOZ 定位 AUC 为 0.77。
研究还试图评估从睡眠和清醒记录中派生的特征如何提高 SOZ 定位。在一项此类研究中,来自非快速眼动睡眠记录的时间域和频谱特征在 SOZ 识别中优于来自清醒记录的特征。进一步的工作扩展了这些发现,表明非快速眼动睡眠期间的致痫性棘波率高于清醒状态,并且在训练有醒着、非快速眼动睡眠记录的逻辑回归模型中,预发作和后发作棘波率在支持向量分类器中使用时,SOZ 定位的 AUC 为 0.83。
工作还在进行中,以解决 SOZ 定位中存在的类别不平衡问题,这源于大多数植入电极不在 SOZ 中。已经开发了一种数据增强技术,该技术涉及通过在频域中对已知 SOZ 数据进行采样并将其转换回时间域来合成生成 SOZ 样本。由此产生的增强数据集导致患者 SOZ 预测准确性提高。
3.2.2 检测间歇期癫痫样放电
间歇期癫痫样放电包括棘波和病理性高频振荡(有时称为涟漪),它们是癫痫灶中的电生理现象,被认为是癫痫灶网络中的自发同步活动。由于它们与致痫性组织有关,准确识别间歇期癫痫样放电可以促进 SOZ 定位。然而,手动识别这些现象既困难又耗时,因为它们的电图外观可以非常不同,而利用 AI 的自动化方法提供了优化其检测的机会。
基于监督深度学习的间歇期癫痫样放电检测方法显示出前景。这种方法的可行性在一开始就得到了证明,当时将原始 iEEG 数据与卷积神经网络结合用于检测间歇期癫痫样放电,其 AUC 为 0.90。此后,性能得到了进一步提高。训练一个卷积神经网络,该网络使用大量人工标注的间歇期癫痫样放电数据集,其 AUC 为 0.99,算法检测到的癫痫样放电中相当一部分被人类标注者遗漏。同样,使用模板匹配进行预处理期间开发的卷积神经网络模型,在模板匹配期间,模板信号与实际信号之间的重叠被用作初始过滤器,将电生理信号转换为类似图像的输入。将模板匹配和卷积神经网络结合使用实现了 AUC 为 0.98 的分类。涉及来自iEEG 数据的各种类似图像输入的类似卷积神经网络方法也实现了儿童新皮质癫痫的交叉验证准确率为 860。相同的方法后来被应用于高频振荡的特征化。
递归神经网络也是检测间歇期癫痫样放电的流行方法,这得益于它们处理时间序列数据的能力。利用长期短期记忆递归神经网络的时间序列处理能力实现了间歇期癫痫样放电的检测,其准确率超过 902。此外,结合长期短期记忆递归神经网络和用于解决类别不平衡问题的生成对抗网络,其 AUC 超过 0.93。
无监督学习方法也已被应用于间歇期癫痫样放电的检测和分类,从而避免了人工标注的需求。非负矩阵分解被应用于间歇期 iEEG 记录,并识别出具有 93% 灵敏度和 97% 特异性的间歇期癫痫样放电。同样,通过层次聚类 iEEG 信号开发了一种无监督算法,用于检测常规和非常规高频振荡。最近,开发了一种基于自编码器特征提取(无监督)和最终分类器(监督)的半监督间歇期癫痫样放电分类方法,该分类器根据自编码器输出估计属于间歇期癫痫样放电类的概率。使用仅 100 个标记样本,这种方法对间歇期癫痫样放电的分类 AUC 为 0.86。
4. 多模态神经影像和电生理学
iEEG提供了很好的时间分辨率,但空间分辨率较差,而神经影像则相反。因此,将颅内电生理学和神经影像结合起来的方法可以充分利用每个模态的最佳特性。将来自两种模态的特征结合到 AI 模型中可以生成一个全面的集合,从而可以跨多个时间和空间尺度提高我们对癫痫的理解。然而,从大型队列中生成可用于研究的多模态 iEEG 和神经影像数据具有挑战性;据我们所知,只有两项研究将多模态 iEEG 和神经影像特征用于癫痫诊断。
在这样一个研究中,多模态 MRI 数据(T1 加权、T2 加权、FLAIR 强度和 DTI 数据)被结合在一个深度残差神经网络中,以将区域分类为 SOZ 或非 SOZ,然后该神经网络的输出与 iEEG 定义的特性相结合,包括病理性高频振荡率。当结合 MRI 和 iEEG 特性时,对 MRI 阴性患者的 SOZ 预测有所提高。在另一项研究中,形态学表面特征与 FLAIR 和 PET 强度在支持向量回归器中结合,以预测电极未植入的脑区的致痫性。为了实现这一点,模型的训练结合了来自 SOZ 数据可用的人群的 iEEG 提取的致痫性。
尽管神经影像和电生理学已经结合在很少的研究中,但它们的成果表明,使用多模态数据和 AI 研究癫痫是一个令人兴奋的领域。这些研究表明,多模态方法可以提供比单一模态方法更好的性能,并且可以揭示单一模态无法揭示的新的见解。然而,多模态数据集成和 AI 应用的挑战仍然存在,包括数据质量、数据一致性、特征选择和模型验证等问题。随着技术的进步和数据量的增加,多模态方法和 AI 应用的潜力将不断增长,为癫痫的诊断和管理提供新的工具和策略。
5. 医学设备
响应神经刺激装置(RNS)的 iEEG 数据已被用于开发和训练用于预测和检测癫痫发作的算法。一些上面讨论的数据集和方法的例子(参见“颅内电生理学”)包括大量的响应神经刺激记录。在一项 2021 年发表的论文中,卷积神经网络被用于使用原始响应神经刺激数据作为输入来检测发作事件,该方法的性能与合格的执法人员从响应神经刺激记录中检测发作的准确性相同。在另一项包括来自 256 名癫痫患者的一百万条响应神经刺激记录的大型数据集中,嵌入方法(包括预训练和自定义训练的卷积神经网络)被用于识别具有相似活动模式的响应神经刺激记录。这种方法提供了一个框架,可以以半监督到完全无监督学习的形式注释大型颅内设备数据集。除了响应神经刺激之外,新的皮下长期脑电图设备提供了更侵入性的选择,可以获取长期记录,并且使用机器学习算法进行癫痫预测的初步工作已经显示出希望,其发作预测 AUC 与最先进的 iEEG 方法相当。
AI 也被用于根据植入设备的治疗反应进行分层。例如,术前全脑至丘脑功能连接和支持向量分类器被用于预测对迷走神经刺激治疗的反应,其准确率为 88%。同样,使用结构连接体和基于 DTI 的磁脑电图功能连接体来训练支持向量分类器,用于预测儿童队列中迷走神经刺激的反应,分别在内部分组和外部组中达到 89% 和 83% 的准确率。
一个可以从 AI 与医疗设备结合中使用中受益的领域是优化响应神经刺激和深部脑刺激的神经刺激参数。当前的策略是基于门诊访问期间的试错,但 AI 可以通过使用基于个体特定设备数据的数据驱动模型来确定最佳的个体特定参数。目前可用的数据集不允许这些方法成功,因为可调节的参数数量仍然太大,无法有效地找到能够实现患者之间有效发作控制的最佳参数。这些挑战可能与高质量 curated 数据集的稀缺有关。随着从植入设备中获得更多数据以及对这些设备的使用经验增加,该研究领域的活动可能会继续活跃。
最后,非侵入式可穿戴设备正在用于预测癫痫发作,但有几个基于 AI 的方法值得注意。在一项研究中,来自癫痫监测单元中佩戴无线腕带的癫痫患者的电皮层活动、体温、脉搏和活动记录被用于与长期短期记忆递归神经网络结合,以预测癫痫发作。在这些参与者的 43% 中,模型的性能优于随机,平均准确率提高了 29%,平均灵敏度为 78%。在另一种涉及使用可穿戴设备的多模态数据和方法中,通过使用来自 iEEG 的特征对网络进行预训练,然后使用来自非侵入式可穿戴设备的细调训练数据来微调网络,转移学习被用于。这种方法提供了证据,表明在一个模态(例如 iEEG)中经过良好训练的模型可以推广到另一个模态(例如可穿戴设备)中,只需要来自第二个模态的少量微调训练数据。
6. 电子健康记录
电子健康记录存储着丰富的患者特定信息,但由于记录数量庞大,人类研究人员无法从中提取和量化所有信息。因此,自然语言处理(NLP)——人工智能的一个子领域,涉及训练机器理解语言——已被应用于癫痫患者的电子健康记录。
在早期研究中,NLP 与传统的机器学习算法结合使用,以从健康记录中提取信息。例如,cTAKES NLP工具与基于规则的解析结合使用,从出院摘要中提取患者和癫痫特征,其 F 分数为 88.53%。同样,Yale cTAKES 扩展 NLP 工具被用于与分类器结合,以将癫痫患者与患有心因性非癫痫事件的人区分开来,其 F分数为 96%。更近期的做法涉及使用大型语言模型(LLM)来提取更复杂的结局指标。在一项研究中,LLM 被细化为从癫痫门诊记录中分类癫痫发作、提取癫痫频率和最后一次发作日期,其性能与人类标注者相当。自从 ChatGPT 发布以来,对在癫痫中应用 LLM 进行医疗记录解释的兴趣有所增加,并且该领域的工作很可能在未来几年呈指数增长。
7. 视频遥测
在癫痫监测单元中评估癫痫患者时,视频记录通常与 EEG(头皮和颅内)结合使用,以将 EEG 结果与行为相关联,这有助于确定发作的半身性和理解每个患者的疾病的解剖电临床特征。然而,这个过程非常耗时,而利用机器学习和深度学习的计算机视觉技术被提议作为替代方案。除了确定半身性之外,视频记录和 AI 也在发作检测和发作分类中用于数据减少(减少人类用户需要审查的记录数量以做出临床决策)。
分析视频记录的算法最有可能作为多模态方法的一部分最有帮助,这些方法将视频中的半身性信息与来自电子健康记录、神经影像和电生理学的信息相结合。一些概念验证研究表明了这种类型的多模态方法;例如,自然语言处理从电子健康记录中提取半身性信息,并结合神经影像数据,以及将 iEEG 数据与视频数据结合。癫痫发作半身性和其与脑异常关系的相关开放数据集,以及来自癫痫患者的视频记录的大型数据集,将有助于多模态集成和该领域未来算法的开发。
图4 癫痫管理中 AI 的未来。
8. 未来 AI 在癫痫管理中的应用
想象一下这样一个未来:AI 系统可以分析大量的临床数据(例如,影像和 EEG 数据)、遗传易感性和环境因素,以预测癫痫发作,准确率无与伦比,甚至可以提前几小时或几天。这些系统如此无缝地集成到日常生活中,以至于可穿戴设备甚至永久植入的设备可以持续监测癫痫患者并警告潜在的触发因素,甚至可以通过神经调节大脑或自主释放药物直接到特定脑区来反应。在这个未来,AI 驱动的平台还可以通过分析个体对治疗的反应来实现个性化治疗计划,创建一种以患者为中心的、实时适应的护理模式,这种模式可以在医生办公室访问之间进行实时调整。我们预计这些系统将成为无缝集成的现实(图4),多模态数据集成提供了一个关于个人状况的全面概述。尽管这看起来可能很具有挑战性,但随着大型、多中心、国际合作的持续发展,帮助个人预测未来状况的多模态集成算法将继续改进。
然而,将这一愿景变为现实取决于解决重大差距和挑战。一个相当大的障碍是需要在临床试验中对癫痫管理中的 AI 应用进行严格验证,目前该领域缺乏此类试验。鉴于一些所需的技术目前尚不存在,许多问题仍未得到解答。在整个疾病阶段管理癫痫护理的大规模 AI 系统的实际成本效益比是什么——例如,效率提高了多少,以及当使用 AI 框架漏诊时,潜在的危害和解决方案是什么?这些系统如何在当前的培训模式下纳入临床工作流程中,因为标准医学课程目前不包括基本的机器学习原理?最大的挑战是开发新的 AI 模型和通过临床试验对其进行验证,还是它们是实施的实际问题——例如,需要标准化数据收集,偏差最小化,以及伦理和法律挑战?
AI 在癫痫管理中的潜力是巨大的,承诺以一种转变以患者为中心的治疗和预测干预的方法。然而,实现这一潜力需要共同努力,弥合科学验证 AI 模型和其实际实施之间的差距。前进的道路必须涉及一种合作方法,将技术专家、医生和政策制定者聚集在一起。随着我们绘制这一路线图,我们必须坚持以患者为中心,确保 AI 在癫痫管理中的演变服务于改善患者结果和生活质量的根本目标。
9. 结论
AI 有潜力通过利用来自神经影像、脑电图、电子健康记录和医疗设备的大量数据来改变癫痫的管理。机器学习为 AI 在癫痫中的应用奠定了基础,并且深度学习技术的采用正在增加,提供了更复杂的分析能力。然而,AI 从研究到临床环境的转变缓慢,强调了研究人员、临床医生和其他利益相关者之间合作以弥合这一差距的必要性。此外,将 AI 集成到癫痫护理中需要仔细考虑方法论和伦理问题,以确保这些技术在不损害安全的情况下提高患者结果。为了充分发挥 AI 的潜力,未来的努力必须专注于进行严格的临床试验和制定伦理指南,以确保 AI 驱动的干预措施既有效又安全。
参考文献:Artificial intelligence in epilepsy —applications and pathways to the clinic.