作者|Memory逆光
本文由作者授权分享
导读
脑电图(EEG)是一个复杂的信号,一个医生可能需要几年的训练并利用先进的信号处理和特征提取方法,才能正确解释其含义。而如今机器学习和深度学习的发展,大量的研究和应用表明它们在从原始数据提取特征并分类方面有很大的潜力。因此这篇综述回顾了从 2010 年到 2018 年的 156 篇将 DL(Deep Learning,深度学习)应用在 EEG 的文章,这些论文涵盖了不同的应用领域,如枕测、睡眠、脑机接口、认知和情感监测,并从大量的文献中提取趋势并突出有趣的方法,以便为未来的研究提供信息并制定建议。
这篇综述将分析每个项目:1)数据、2)预处理方法、3)DL设计选择、4)结果和5)实验重现性;
之前分享了综述的总体概述《基于深度学习的脑电图识别 综述(一)总体概述》,这篇主要分享数据采样、数据扩充、数据处理(预处理、人工处理)、特征提取等进行了解说和汇总。
文章选取和分布
本文选取了 2010 到 2018 年间相关的论文,对于每一篇被选择的文章,大约70个数据项被提取出来,包括 5 个类别:文章的来源,基本原理,使用的数据,脑电图处理方法,深度学习方法和报告的结果;
下图为为所选的每个项目提取数据项
最终作者选取了 156 篇论文,选取过程如下:
第一作者的国籍分布(所以中国还是很猛的):
大多数研究(86%)集中于使用深度学习对脑电图数据进行分类,最显著的是用于睡眠分期、癫痫发作检测和预测、脑机接口(BCIs)以及认知和情感监测;
大约 9% 的研究集中在处理工具的改进上,比如从脑电图中学习特征,处理工件,或者可视化训练过的模型;
其余的论文(5%)探讨了从脑电图中产生数据的方法,如增加数据或以脑电图为条件生成图像;
研究重点分布如下,其中每个类别的论文数量在括号中显示,涉及一个以上主题的研究按其主要关注点进行分类:
增长趋势为:
数据量:
上图左栏显示了每项研究(包括训练、验证和测试集)中使用的脑电图数据量(以分钟为单位);
注意,这里报告的时间不一定对应于实验的总记录时间,研究的总记录时间的均值为 62,602,中位数为 360;
中间栏是每项研究的样本数,根据滑窗大小和重叠度不同,这个值有很大的差异,均值为 251,532, 中位数为 14,000;
右栏是每项研究脑电图数据时长跟样本数的比值;
实际观察主题数:
超过一半的研究主题数都在 13 以下;
采样参数:
采样的设备统计如下:
采样时的通道数(即电极数)统计如下:
从理论上讲,通道数越多,空间分辨率越高,但是较多的采样电极会造成患者的不适,并且增加采样成本,而且邻近的电极差异不是很大;
研究发现,通道数从 4 提高到 22 有很好的提升效果,其中敏感度从 31% 提高到了 39%,特异性从 40% 提高到了 90%;
采样频率大部分集中在 100 Hz 到 1000 Hz 间,其中 50% 使用了 250 Hz 或者更小的频率;
数据扩充
如果处理得当,数据扩充可以提高准确性和稳定性,从而更好地泛化新数据;
156 篇论文中有 3 篇分别从睡眠,情感监测和脑机接口三个方向,明确论述了 DL-EEG 中的数据扩充;
- 使用随机高斯噪声,在 SEED 和 MAHNOB-HCI 数据集上,LeNet 和 ResNet 的准确率都有了很大的提升;其最佳精度为使用 0.2 的标准偏差,并通将数据增加到原始大小的30倍;
- 利用条件深卷积生成对抗网((cDCGAN)在 BCI 图像数据集上生成人工脑电图信号,可以发现数据扩充有助于将运动图像分类的准确率从 83% 提高到 86% 左右;
- 通过在 CAPSLPDB 数据集上生成原始脑电图数据的傅里叶变换(FT)来明确针对代表性不足的睡眠阶段的类不平衡问题;
其他的论文中采用的数据扩充方法有:
- 向 2D 的特征图中增加随机噪声;
- 使用眨眼、肌肉活动以及高斯白噪声等伪影被用来增强数据并提高鲁棒性;
- 向输入的特征向量中加入高斯噪声;
- 使用重叠窗口,即通过生成更多的具有较小移位的训练样本,性能有了显著提高;
- cropped training,即不规则训练,保证每个窗口只训练一次;
- 加大共享信息窗口分类不一致时的惩罚项;
- 交换左右电极;
- 复制样本并只保留一种模态的值,同时将另一种模态的值设置为0,反之亦然;
- 利用在预处理阶段向下采样脑电图时经常丢弃的数据,即在下采样参数为 N NN 时允许数据扩充 N NN 倍;
- 为每个类别单独训练 GAN 生成新数据;
数据处理
统计数据如下(N/M 是在研究中未提及):
预处理:
通常的预处理方式有:下采样、带通滤波和滑窗;
有的研究提出,需要对脑电图试验进行修剪,将数据采样到 512 Hz 和 64 个电极,识别噪声通道,计算平均参考线,去除线噪声,并对从 1 Hz 开始的数据进行高通滤波;
有的关于睡眠的研究则下采样到 256 Hz 并移除噪声通道,从 2 Hz 开始进行滤波;
人工处理:
人工处理用于移除特定的噪声,比如眼部和肌肉的伪影,从而学习的负担从潜在的噪声信号转移到神经网络上;
有些研究采用了基于人类知识的方法,如振幅阈值化、人工识别高方差段、基于高振幅 EOG 段处理与眨眼相关的噪声等;
许多其他文章支持不太依赖人工干预的技术,比如盲源分离技术,例如,ICA(独立成分分析)被用来从脑电图数据中分离眼部成分;
为了研究在使用深度神经网络时去除脑电伪迹的必要性,本文将选取的论文分为三类,特征工程是传统脑电信号处理管道中要求最严格的步骤之一46% 的论文没有使用伪迹处理方法,24% 的论文使用了这种方法,31% 的研究没有提及是否需要人工处理来达到他们的结果;
特征提取
特征工程是传统脑电信号处理系统中要求最严格的步骤之一;
虽然一些研究表明,使用深度信念网络(DBNs)可以接受原始数据输入,但是也有相当比例的评论论文使用人工设计的特征作为其深度神经网络的输入;
例如,可以使用通过快速傅里叶变换(STFT)获得的脑电图的时频域表示来检测二进制用户偏好(喜欢与不喜欢);也有研究使用 STFT 作为二维 EEG 表示,用于在 CNN 中使用癫痫 预测;
脑电图学界广泛采用的特征是约1 Hz~40 Hz的经典频带的功率谱密度(PSD);
还有一些研究采用了多种特征的组合,如使用PSD特征,以及熵、峰度、分形分量等作为提出的 CNN 输入,用于缺血性脑卒中检测;
尽管如此,仍有 49% 研究使用了 EEG 的原始数据作为输入;
作者博客
https://blog.csdn.net/weixin_44936889/article/details/104686542
文章来源于网络,仅用于学术交流,不用于商业行为
若有侵权及疑问,请后台留言,管理员即时删侵!