基于深度神经网络的个性化睡眠癫痫发作预测
程晨晨1,3, 尤波1,2, 刘燕2,3,4, 戴亚康3,4
1.哈尔滨理工大学 机械动力工程学院 哈尔滨 150080
2.哈尔滨理工大学 自动化学院 哈尔滨 150080
3.中国科学院苏州生物医学工程技术研究所 医学影像技术研究室 苏州 215163
4.苏州市医疗健康信息技术重点实验室 苏州 215163
通信作者:

戴亚康,博士,研究员,主要研究方向为智能医学影像处理分析.E-mail:daiyk@sibet.ac.cn.

作者简介:

程晨晨,博士研究生,主要研究方向为神经电生理信号分析、机器学习、模式识别.E-mail:chengchenchen2018@163.com.

尤 波,博士,教授,主要研究方向为机器人、神经电生理信号分析、机器学习、模式识别等.E-mail:youbo@hrbust.edu.cn.

刘 燕,博士,副研究员,主要研究方向为多模态神经影像智能处理分析.E-mail:liuyan@sibet.ac.cn.

摘要

现有癫痫发作预测方法存在精度较低、错误报警率较高、癫痫患者睡眠脑电特异性、致痫灶位置和类型不同导致脑电信号存在差异的问题.文中提出基于深度神经网络的个性化睡眠癫痫发作预测方法,帮助医生和患者采取及时有效的治疗措施,降低患者患并发症和猝死的概率.对原始脑电信号滤波和分段以去除噪声,保证短时间内触发警报,利用离散小波变换分解信号并提取统计特征表征脑电信号时频特征.再应用双向长短期记忆网络挖掘最具鉴别能力的特征并结合留一法分类,经过决策过程优化得到预测结果.在不同频带限制条件下的实验表明,与睡眠癫痫相关的δ频带信号是影响发作预测性能的重要因素.相比现有睡眠癫痫预测方法,文中方法性能较优.

关键词: 癫痫发作预测; 睡眠脑电(EEG); 深度神经网络; 个性化
中图分类号:R 318 文章编号:2021,34(4):333-342
A Patient-Specific Method for Epileptic Seizure Prediction During Sleep Based on Deep Neural Network
CHENG Chenchen1,3, YOU Bo1,2, LIU Yan2,3,4, DAI Yakang3,4
1. School of Mechanical and Power Engineering, Harbin University of Science and Technology, Harbin 150080
2. School of Automation, Harbin University of Science and Technology, Harbin 150080
3. Medical Imaging Technology Laboratory, Suzhou Institute of Biomedical Engineering and Technology, Chinese Academy of Sciences, Suzhou 215163
4. Suzhou Key Laboratory of Medical and Health Information Technology, Suzhou 215163
Corresponding author:
DAI Yakang, Ph.D., researcher. His research interests include intelligent medical image processing and analysis.

AboutAuthor:
CHENG Chenchen, Ph.D. candidate. Her research interests include neural electrophysiological signal analysis, machine lear-ning and pattern recognition.
YOU Bo, Ph.D., professor. His research interests include robot, neural electrophysiological signal analysis, machine learning and pattern recognition.
LIU Yan, Ph.D., associate professor. Her research interests include multi-modal neuroimaging intelligent processing and analysis.

Abstract

The existing epileptic seizure prediction methods present the problems of low accuracy, high false alarm rate, sleep electroencephalogram(EEG) specificity of epileptic patients and differences in EEG signals caused by differences in the location and type of epileptic foci . In this paper, a patient-specific method for epileptic seizure prediction during sleep based on deep neural network is proposed to help doctors and patients to take timely and effective treatment measures. Consequently, the probability of patients suffering from complications and sudden death is reduced. The original EEG signals are filtered and segmented to remove noise and trigger the alarm in a short time. Discrete wavelet transform is utilized to decompose the EEG, and statistical features are extracted to reveal the time-frequency characteristics of EEG signals. Then, the bi-direction long-short term memory(Bi-LSTM) is employed to mine the most discriminative features combined with the leave-one-out method for classification. The prediction results are obtained after the optimization of the decision-making process. Experiments with different frequency band restrictions show that the δband signal related to sleep epilepsy affects the prediction performance and the performance of the proposed method is better than the existing sleep epileptic seizure prediction methods.

Key words: Epileptic Seizure Prediction; Sleep Electroencephalogram(EEG); Deep Neural Network; Patient-Specific

本文责任编委 杨勐

Recommended by Associate Editor YANG Meng

癫痫是一种慢性神经性系统疾病, 具有不确定性、突发性等特点, 癫痫发作时患者的肢体运动异常, 意识和知觉丧失, 严重时甚至会导致死亡[1].当癫痫发作发生在睡眠中, 患者无法向其所在的周围环境实时呼救以应对紧急情况, 可能会增加患者烧伤、骨折甚至突发意外死亡的比率[2].癫痫患者占全世界人口的1%, 其中30%的癫痫患者为抗药性难治患者, 这其中40%的难治性癫痫患者不具备手术治疗条件, 因此预测癫痫发作成为此类患者的一种主要的干预手段[3].

癫痫患者的大脑活动随时间变化且在发作之前的电活动明显.目前, 监测大脑神经元间电活动的方式包括核磁共振成像(Magnetic Resonance Imaging, MRI)、脑磁图(Magnetoencephalography, MEG)、脑电图(Electroencephalogram, EEG)和正电子断层成像(Positron Emission Tomography, PET)等[1].EEG因采集方便、成本较低、利用率较高等特点被广泛应用于癫痫的诊断和分析中.在通常情况下, 脑电图有颅内脑电图和头皮脑电图两种形式, 头皮脑电图在患者日常监测和癫痫研究方面具有更高的实用性和易用性.根据脑电信号随时间动态变化的特点, 癫痫患者的大脑神经元活动分为4种状态:发作前期、发作期、发作后期、发作间期[4].

癫痫发作具有偶然性和不确定性, 给患者及其家人乃至社会带来沉重的心理负担和经济负担.如果在患者癫痫发作前的某个时间点给出发作警报, 给予患者本身及其看护者足够的应对时间以进行适当的治疗措施, 那么这不仅提高患者及其家人的生活质量, 还提高社会的综合幸福感[1].根据癫痫信号状态的类别划分, 癫痫发作预测被看作发作前期和发作间期脑电信号之间的二分类问题.有监督的癫痫发作预测方法主要包含两个阶段:特征提取和分类.基于癫痫脑电信号进行特征提取抓获大脑神经元之间的电活动特点, 随后利用提取的特征训练分类器, 通过识别癫痫发作前期的数据, 完成癫痫发作预测.

据相关研究, 特征提取方法主要包括:时域、频域和时频域[5].原始脑电信号是随着时间变化的时序信号, 信号中每个离散点表示在某一时刻的能量密度或电压值[6].时域特征是对脑电信号进行最基本特征属性的刻画.Ghayab等[7]从脑电信号中提取10个统计特征作为分类的输入.Parvez等[8]以相位相关作为特征预测癫痫发作的发生.

此外, 频域特征提取方法以特征的形式表达信号在频域上的能量变化, 如功率谱密度、傅里叶变换等, 利用信号的相对谱功率跟踪癫痫发作前的变化.Polat等[9]结合Welch谱分析和傅里叶变换, 获得129个频域特征, 进而预测癫痫的发生.尽管时域特征提取方法及频域特征提取方法在癫痫发作预测中达到一定的预测效果, 但局限于单一域特征以预测癫痫发作, 忽视脑电信号的动态特性[10].因此, 衍生基于时频域的特征提取方法.对脑电信号的时频分析方法包括Gabor变换、Hilbert-Huang变换(Hilbert-Huang Transform, HHT)、小波变换等.小波变换可在时域和频域上对信号的突变进行局部化, 在低频时给出精确的频率信息, 在高频时给出精确的时间信息.这一特性使其适于脑电等非平稳信号的分析, 在癫痫脑电信号分析和特征提取阶段能灵活运用[11].离散小波变换(Discrete Wavelet Transform, DWT)具有高度分析能力, 能多尺度多分辨率地分析类似脑电这种非平稳非线性信号[12].

在分类阶段, 多种分类算法被广泛应用于二分类任务和多分类任务中.基于传统机器学习的分类器广泛应用于癫痫发作预测研究中, 如支持向量机(Support Vector Machine, SVM)、随机森林(Random Forest, RF)、K近邻(K-Nearest Neighbor, KNN)、决策树(Decision Tree, DT)等.研究表明基于传统机器学习方法处理分类问题时, SVM呈现较优效果[13].另外, 各种人工神经网络在预测癫痫发作效果上优于传统的机器学习方法.Ozdemir等[14]介绍基于HHT和贝叶斯神经网络的方法, 灵敏度为96.55%, 每小时的错误报警率为0.21.Osman等[15]提出基于多种径向基函数神经网络算法(Radial Basis Function Neural Network, RBFNN)和集成自组织特征映射算法(Self-Organizing Feature Map, SOM)的癫痫自动诊断方法, 经10次交叉验证, 准确率为97.47%.

此外, 深度学习神经网络利用多个隐藏层对数据进行更深层次的挖掘, 并具有自动特征选择的优势, 实现高精度的预测效果[1].Tsiouris等[16]将多种特征与双层长短期记忆网络(Long-Short Term Memory, LSTM)结合, 以99.28%~99.24%的灵敏度和每小时0.11~0.02的误报率评价癫痫发作预测方法的性能.Daoud等[5]提出基于深度神经网络和长期头皮脑电的针对特定患者癫痫发作预测方法, 利用深度卷积自编码(Deep Convolutional Auto-encoder, DCAE)挖掘最具代表性的特征, 以双向LSTM(Bi-direction LSTM, Bi-LSTM)作为分类器, 准确率高达99.6%, 每小时误报率低至0.004.因此, 深度神经网络在癫痫发作预测中能实现较好的分类精度.

目前, 各种癫痫发作预测方法被提出以期达到高精度、低误报率的预测结果[5].由于受试者年龄、性别、癫痫发作类型及致痫区不同, 对脑电数据的影响不同, 因此患者间的脑电信号存在差异.研究表明, 癫痫脑电信号中的生物标记物具有个性化的特点, 因此有必要对研究对象提供个性化的预测方案[17].

睡眠脑电图分析是医学中一个重要的研究分支, 它的临床应用和脑动力学具有研究意义.脑电波在睡眠状态下变化缓慢, 相比清醒状态, 具有明显的差异, 导致在两种状态下的脑电数据的特征不同.Rajendra等[18]认为频率0.5~4 Hz的δ波和频率4~8 Hz的θ波在睡眠状态中占主导地位[18].但在相关癫痫发作预测研究中, 无论EEG信号处于清醒还是睡眠状态, 频率在0.5~4 Hz的δ波都被丢弃.因此, 应用此类方法对睡眠中癫痫脑电信号进行预测可能会导致低精度或高误报率[2].

针对上述问题, 本文针对特定患者提出基于深度神经网络的个性化睡眠癫痫发作预测方法, 帮助医生和患者采取及时有效的治疗措施, 降低患者患并发症和猝死的概率.对原始脑电信号滤波和分段以去除噪声, 保证短时间内触发警报, 利用DWT分解信号并提取统计特征表征脑电信号时频特征.然后应用Bi-LSTM挖掘最具鉴别能力的特征并结合留一法分类, 经过决策过程优化得到预测结果.在不同频带限制条件下的实验表明, 与睡眠癫痫相关的δ频带信号是影响发作预测性能的重要因素.与现有睡眠癫痫预测方法相比, 文中方法性能较优.

1 基于深度神经网络的个性化睡眠癫痫发作预测

本文提出的睡眠癫痫发作预测方法包括预处理、特征提取、分类模型构建、后处理4个模块, 具体框图如图1所示.

图1 本文方法框图Fig.1 Framework of the proposed method

首先, 对每位癫痫患者发作前期和发作间期的原始脑电信号进行滤波和滑动窗分段, 保证数据无冗余且报警能在短时间内执行.再利用DWT获得每个时间窗的小波系数, 得到计算统计特征, 实现数据降维并组成特征向量.然后, 基于Bi-LSTM的深度学习神经网络并结合留一交叉验证法(Leave-One-Out Cross Validation, LOOCV)构建分类模型.最后, 针对分类模型的输出结果进行决策处理以减少错误预测.

1.1 预处理

预处理是特征提取阶段之前对原始数据库进行处理的一个重要阶段.通常情况下, 预处理过程包括:去除伪迹干扰和信号分段.限制脑电信号的分析频带, 可在一定程度上去除信号采集期间的工频干扰和伪迹, 进行下一步的分析[19].从生理角度上看, 大于60 Hz频率的信号归类为噪声, 应丢弃.另外, 考虑到睡眠癫痫脑电信号的特殊性, 结合数据的采样频率、奈奎斯特准则和工程要求等, 采用0.5~32 Hz的四阶巴特沃斯滤波器设计零相移滤波器处理数据.

此外, 为了确保在短时间内触发警报, 将长程脑电信号分成若干段.在分段阶段, 窗口大小和重叠率是两个重要的参数.选择合适的窗口大小可获得良好的分类性能.本文采用相邻窗口有一半重叠的4 s滑动窗将EEG信号分段, 该滑动窗长度足以捕获信号的主要平稳特征和癫痫发作的突变.

1.2 特征提取

特征提取可增加分析任务的有效性, 提高模型精度, 减少计算复杂度[20].研究表明, 相比直接使用原始脑电片段作为分类器输入, 分类前的特征提取更有益于分类性能的提高, 因为特征提取可从可用导联的EEG信号中获取有关信号或大脑区域连通性的隐藏信息[6].

原始脑电信号是时域信号, 尽管信号包含一些有用的时域特征, 但其它域中的特征也可用于提取更具鉴别能力的信息[6].时频特征描述信号在不同时间点的瞬时频率, 能捕获脑电信号非线性和非稳定性的特征.

DWT是一种常见的小波变换方法, 可用于获取脑电信号的时频特征.合适的小波函数和分解层次的选择直接影响小波变换的分析效果.由于小波基函数阶数会随函数的光滑性和在频域的局部化能力而增加, 因此函数的阶数越高, 频带分割效果越优.然而, 高阶消失矩的存在会导致计算时间的增加, 并降低实时性.本文采用具有良好正则性的Daubechies(dbN)小波基函数, 四阶Daubechies小波(db4)被认为是分析癫痫脑电数据最合适的方法[6].如图1中特征提取模块, 利用db4小波基对睡眠EEG信号进行小波分解.节点AAAA4(0.5~2 Hz)和ADDD4(2~4 Hz)表示δ波, ADD3(4~8 Hz)节点表示θ波, AD2节点与α波(8~16 Hz)的频带匹配, 节点D1表示β 波(16~32 Hz).

统计特征描述序列的振幅分布和形状的信息, 研究表明, 统计特征在头皮脑电信号癫痫预测上表现良好.信号经过小波变换后, 在每个频段上提取统计特征(峰值、谷值)组成特征向量:

Xi, j=[MaxVδ1MinVδ1MaxVδ2MinVδ2MaxVθMinVθMaxVαMinVαMaxVβ MinVβ ]T,
MinV=min(ck), MaxV=max(ck).

其中:ck表示k频段的小波系数, k=1, 2, …, 5; Xi, j表示第i时间窗第j导联的特征向量, j=1, 2, …, 23, i=1, 2, …, N, N表示每个患者时间窗的总个数.

值得注意的是, 特征集呈现给下一步算法之前需经过zscore函数规范化, 即

z= Xi, j-μσ,

其中, Xi, j表示特征向量, μ 表示特征向量平均数, σ 表示特征向量标准差.

1.3 分类模型构建

信号特征组成向量, 再应用相关分类算法对其进行辨识完成分类[21], 从而对数据进行标注转化为分类问题并实现预测.分类器是对样本进行分类的方法统称, 随着模式识别理论的不断丰富, 大量的分类算法被推广并应用于神经电生理信号领域.对于训练数据集{xi, yi}, xi为提取的脑电信号特征, yi为类别标签, i为训练集样本数量.在训练阶段, 通过分类器得到训练特征向量与特征类别标签的映射函数Λ .在测试阶段, 对于未知的测试特征向量, 通过映射函数Λ 得到预测特征向量的类别标签, 实现对未知特征向量的辨识, 完成预测任务, 因此应选择合适的分类算法对特征向量进行辨识.在本节中, 基于不同的深度神经网络和传统机器学习分类算法构建不同的分类器, 用于评估预测表现.

1.3.1 深度神经网络

癫痫患者的临床症状会随着时间的推移而改变.因此有必要通过选择性地收集癫痫发作模式以调整预测规则.深度学习神经网络是指利用多个隐藏层在足够大的数据集中自动提取最具鉴别能力的特征, 能在学习时不断更新网络, 达到提高分类精度的目的[5].另外, 深度学习神经网络可通过一系列算法避免训练数据过度拟合, 因此, 基于目前应用最广泛的深度学习网络构建如下分类器:多层感知机(Multi-layer Perception, MLP)、长短期记忆网络(LSTM)和双向长短期记忆网络(Bi-LSTM).

人工神经网络(Artificial Neural Network, ANN)可解决复杂问题, 是一种应用于生物建模的有效工具, 能够减轻医学诊断专家的负担.ANN模拟人类认知过程的信息处理系统, 由许多相互连接的神经元组成[12].

目前, 应用最广泛的ANN是多层感知机(MLP), 它在神经网络的应用中发挥着核心作用[5].MLP是由具有多个隐藏层的逆向传播(Back Propagation, BP)神经网络构成, 可更新网络参数以获得良好性能.BP神经网络是一种多层前馈人工神经网络, 主要特点是信号前向传播、误差反向传播.BP神经网络可看作一个非线性函数, 网络的输入值和预测值分别为该函数的自变量和因变量.

循环神经网络(Recurrent Neural Network, RNN)是一种能沿输入序列保持序列状态的神经网络, 根据对先前序列所做的处理以处理数据的时间序列.RNN的这一特性使其适用于脑电信号等时间序列数据的预测.LSTM是RNN的一种.LSTM在训练过程中保持梯度值, 并通过层和时间序列进行反向传播, 解决梯度消失的问题, 使其具有学习长期依赖信息的能力[5, 16].

基础LSTM单元由3个控制门组成.输入门决定是否用新的单元状态更新单元, 遗忘门控制细胞状态重置, 输出门决定要传输到下一个块的信息量.任何一个LSTM单元在每个时间步长下包含2种状态.各个控制单元门的数学表达式如下:

其中, xt表示t时刻的输入, ct表示t时刻的单元状态, ht表示t时刻的隐藏状态, ω 表示权重, b表示偏差参数, σ 表示softmax函数, 􀳱表示Hadamard乘积运算符, c~t表示更新ct的候选者.

基于LSTM块, 构建Bi-LSTM, Bi-LSTM中的每块由2个LSTM块组成, 这2块同时处理2个相反方向的时间序列.在前向传输块中, 特征向量从第一时间序列开始处理到最后, 而后向传输块以相反的顺序处理相同的段[5].每个时间步长的网络输出是该步长2个块的组合输出.除了包含标准LSTM中处理先前的上下文内容模块以外, Bi-LSTM也处理未来的上下文内容[1], 从而改进预测结果.因此, 本文采用Bi-LSTM作为后端分类器, 对DWT联合时频域生成的特征向量进行分类.该方案由单个双向层组成, 在该层处理完所有特征向量后, 在最后一个时间步上预测类标签.

1.3.2 传统机器学习算法

传统分类算法对经特征提取后的脑电特征进行分类, 从而识别不同类型脑电信号而被广泛应用, 因此, 本文列出被广泛应用的KNN和RF作为对比方案.

KNN是一种思路简单、直观、容易快速实现的惰性学习分类算法.主要思路为:通过寻找与未知特征样本距离最近的K个训练特征样本, 根据这些特征样本确定未知样本的类别标签属性[22], 失误率较低.KNN的具体步骤如下.

1)计算测试特征样本与各个训练特征样本之间的距离, 按照距离的递增关系进行排序.

2)取距离最小的K个特征样本并确定其所在类别出现的频率.

3)返回前K个特征样本中出现频率最高的类别属性, 作为测试特征样本的预测分类标签属性.

RF思想是包含多个随机形成且彼此无关联关系的决策树, 输出的类别标签属性是由所有树输出的类别的众数而定[9].当测试特征样本进入随机森林时, 意味着其中的每棵决策树均参与分类, 并将所有决策树中分类结果最多的那类作为最终结果.随机森林的算法步骤如下.

设特征样本的类别标签属性个数为A, a为整数, 0< a< A.

1)利用Bootstrap方法对特征样本重采样, 随机产生R个训练集F1, F2, …, FR.

2)利用每个训练特征样本集, 生成对应的决策树D1, D2, …, DR.在每个非叶子节点(内部节点)上选择样本属性之前, 从A个样本属性中随机抽取a个属性作为当前节点的分裂样本属性集, 并以这a个属性中最好的分裂属性对该节点进行分裂.

3)每棵树都完整成长, 不进行剪枝处理.

4)对于测试集特征向量E, 利用每个决策树进行测试, 得到对应的类别标签属性L1(E), L2(E), …, LR(E).

5)采用投票的方法, 将R个决策树输出最多的类别属性作为测试集特征向量E所属的类别标签.

1.4 后处理

为了减少分类输出不希望的波动, 利用后处理决策过程优化输出结果[19], 即对每位患者的分类输出进行决策处理.在本文中, 发作前的脑电片段被标记为1, 发作间期的脑电片段被标记为0.决策算法的定义如下:

f(x)= 1, O(x)O(x+1)==10, 其它

其中, O(x)表示分类器的输出, f(x)表示决策后的结果.

2 实验及结果分析

具体实验硬件环境为包含3.90 GHz的Intel Core i3-6320处理器和64位操作系统的Lenovo电脑, 软件环境为Matlab2020b.

利用CHB-MIT公开数据集中符合条件的2位受试者的睡眠脑电信号评估本文方法.首先, 使用零相位滤波器将睡眠EEG的频带限制在0.5~32 Hz内.再基于db4小波基函数对滤波后的信号进行四层离散小波变换, 提取分解后小波系数的统计特征.然后, 将统计特征组成特征向量输入Bi-LSTM中, 得到分类结果.为了减少分类输出的意外波动, 对输出进行决策后处理.通过计算基于时间窗的预测准确性、特异性、敏感性和基于事件的预测误报率等性能指标, 评估本文方法.

2.1 实验数据

CHB-MIT数据库(http://www.physinet.org/pn6/chnmit)是基于头皮脑电信号的癫痫预测方法中常用的数据库.数据库包含波士顿儿童医院的23名儿童难治性癫痫患者, 记录几天内没有任何药物治疗的头皮脑电图信号, 用于评估外科干预效果.根据国际10-20导联系统放置电极进行数据采集, 信号的采样频率为256 Hz, 分辨率为16.有关该信号更多细节见文献[23].

根据数据库中的注释文件, 数据库中的脑电信号存在通道数目、发作持续时间、癫痫发作次数等多种变量[16].只有一次癫痫发作患者的数据训练模型可能导致模型过度拟合, 无法预测其它发作[24].因此, 在训练阶段必须选择至少2次癫痫发作的数据, 并用另一次癫痫发作数据进行测试.

尽管目前大量的研究工作致力于癫痫发作的预测, 但没有金标准定义发作前的持续时间[5, 16].本文选择每次发作前30 min的脑电信号作为发作前期数据, 并在整个睡眠发作间期数据库中随机选取发作间期数据.选择记录不中断并可获得完整的23导联记录的2位患者脑电数据进行实验.

具体可用导联包括:FP1-F7, F7-T7, T7-P7, P7-O1, FP1-F3, F3-C3, C3-P3, P3-O1, FP2-F4, F4-C4, C4-P4, P4-O2, FP2-F8, F8-T8, T8-P8, P8-O2, FZ-CZ, CZ-PZ, P7-T7, T7-FT9, FT9-FT10, FT10-T8, T8-P8.

有关受试者的更多详情如表1所示.

表1 本文所用受试者的基本信息 Table 1 Basic information of subjects
2.2 评估指标

为了扩大评估的范围, 评估基于时间窗和基于事件的预测性能[5, 16].

在基于时间窗的性能评估中, 准确度(Accu-racy, ACC)、特异度(Specificity, SPEC)和灵敏度(Sensitivity, SEN)被广泛用于分析分类技术的准确性, 计算方法如下:

ACC= TN+TPTN+FP+FN+FP,
SPEC= TNTN+FP,
SEN= TPTP+FN

其中, TP表示真阳性, TN表示真阴性, FP表示假阳性, FN表示假阴性.

对于基于事件的性能评估, 使用错误报警率(False Alarm Rate, FAR):

FAR= NalarmNw0,

其中, Nalarm表示发作间期中警报的时间窗口数, Nw0表示发作间期的总时间窗口数.

2.3 训练和测试方法

为了保持数据集平衡, 随机截取发作间期EEG信号作为样本空间, 并从中随机选择发作前期相同数量的信号段作为发作间期数据.患者脑电数据特征因人而异, 因此, 癫痫发作前脑电图的预测变化量及检测这些变化的最佳方法可能因患者而异.为了保证本文方法的鲁棒性和普适性, 使用LOOCV技术作为训练和测试方法, 对癫痫患者提供个性化预测方案[5].

在LOOCV中, 对于特定病人, 训练次数等于癫痫发作次数.在每次训练期间, 除了一次癫痫发作的数据用于测试外, 其它所有癫痫发作的数据都参与训练过程, 通过改变被试的癫痫发作次数的数据重复这个过程, 完成分类.通过此方法, 确保所有癫痫数据都经过测试阶段, 每位患者的预测评价结果由多次测试结果的平均决定.

2.4 超参数设置

基于BP神经网络构建含有3个隐藏层MLP深度学习网络, 网络拓扑结构如图2所示.

图2 MLP神经网络拓扑结构图Fig.2 Topology of MLP neural network

将特征向量分类到相对的子类(发作前期/发作间期)中, 超参数设置如表2所示, 在隐藏层中, N1=20, N2=10, N3=5.隐含层为tansig, 输出层为purelin, 训练函数为trainlm, 网络学习函数为Learngd.

表2 MLP预测模型的超参数设置 Table 2 Hyper-parameter settings of MLP model

基于LSTM深度学习网络构建分类器.分类器包括6个网络层:输入层、LSTM层、失活(Dropout)层、全连接层、Softmax层和分类输出层.由于本文方法面向对象为特定患者, 因此每位受试者的预测模型的超参数不同.具体的参数设置如表3所示.另外, 优化器为Adam, 损失函数为Cross-entropy.

表3 LSTM预测模型的超参数设置 Table 3 Hyper-parameter settings of LSTM model

基于Bi-LSTM深度学习网络构建分类器.分类器包括6个网络层:输入层、Bi-LSTM层、Dropout层、全连接层、Softmax层和分类输出层.由于本文方法面向特定患者, 因此每位受试者的预测模型的超参数不同, 具体的参数设置与LSTM深层网络一致.以chb01患者第1次发作为例, 训练的曲线如图3所示.在训练周期中, 每轮迭代次数为28, 最大迭代次数为840.使用单CPU, 学习率调度为常数, 学习率为0.01.

图3 Bi-LSTM深度网络的训练曲线Fig.3 Training curves of Bi-LSTM deep network

基于Bi-LSTM的预测模型的每层设置如下.

1)输入层.输入数据, 即时频特征组成的特征向量, 每个输入向量包括导联维度和特征维度, 导联维度为23, 特征维度为10.

2)Bi-LSTM层.设置网络中隐藏单元数量.

3)Dropout层.为防止网络的过拟合, 增强网络的泛化能力.

4)全连接层.每个神经节点均与上一层的每个神经节点连接, 将输入的特征空间线性映射到另一个特征空间.

5)Softmax层.将输出转换为各类别的概率数值.

6)分类输出层.保存用于训练网络的丢失函数的名称、输出大小和类标签.

基于KNN构建分类模型, 其中, K值一般根据经验规则设定.经验规则是指K一般低于训练样本的平方根.K值选择过小, 得到的近邻数过少, 预测精度降低, 同时也会放大噪声数据的干扰.如果K值选择过大, 并且待分类的特征向量数据训练集上包含数据量较少的类, 在选择K个相邻时, 实际上并不相似的数据也被包含, 造成噪声增加, 同时导致预测效果的降低.因此, 通过实验及相关文献, 本文设定K=10.

基于RF构建分类模型, 本文使用科罗拉多大学博尔德分校开发的随机森林工具箱.选择的RF决策树m=500.值得注意的是, 在整个森林的生长过程中, m值维持不变.

2.5 实验结果

为了验证本文方法的可预测性, 设计如下3个实验.

1)探讨睡眠脑电信号的特征.利用离散小波变换将睡眠脑电信号分解为5个子带, 结合Bi-LSTM深度学习网络进行癫痫发作预测, 利用预测结果直观反映睡眠信号的特点.由于睡眠时存在0.5~4 Hz的EEG信号, 而在清醒状态下消失, 针对这一特点, 验证δ子带在睡眠癫痫发作预测中的作用.

2)为了突出Bi-LSTM在睡眠癫痫发作预测中的分类性能, 基于不同算法设计分类器并进行对比实验.

3)为了进一步评估本文方法, 在前面相关步骤的基础上, 将取得的实验结果进行对比, 并且对比其他学者在相同状态下使用相同数据集的工作.

2.5.1 睡眠相关脑电频段的特征对预测结果的影响

相比清醒状态, 睡眠期间的脑电图呈现不同的特点[2].为了更直观地反映睡眠信号的特征, 采用离散小波变换将脑电信号分解为5个子带, 提取睡眠脑电信号0.5~4 Hz的特殊频率.对比方案摒弃提取的0.5~4 Hz频率内的特征作为分类器输入.方案1分类器的输入包含0.5~4 Hz频率的时频特征, 而方案2未考虑.2种方案评价结果如表4所示.由表可看出, 在基于时间窗的性能评估中, 方案1的整体预测性能高于方案2.因此, 0.5~4 Hz的脑电信号频率是睡眠中癫痫发作预测的重要影响因素.对于癫痫发作预测的相关研究, 需要对脑电状态进行细化分析.这种混淆所有脑电信号状态的算法不适合癫痫发作预测的实际应用.

表4 探究睡眠脑电特点的两种方案评价结果对比 Table 4 Evaluation result comparison of 2 schemes studying characteristics of sleep EEG %

2.5.2 有效性分析

为了突出Bi-LSTM在睡眠癫痫发作预测中的分类性能, 基于不同分类算法设计分类器并进行对比实验.另外, 为了进一步评估本文方法, 在之前相关步骤的基础上, 将取得的相关实验结果进行对比, 并且也与其他学者在相同状态下使用相同数据集的预测工作进行对比.

为了论证Bi-LSTM相比其它分类算法在癫痫发作预测中的优点, 利用相同数据进行相应的对比实验.对比实验的相关方法包括:其它深度学习网络(LSTM、MLP), 传统机器学习分类方法(KNN, RF).

表5为各方法的实验结果对比.由表可知, 相比机器学习分类方法, 深度学习网络分类的预测性能呈现较高的表现, 正如相关研究所述, 深度学习网络能学习更深层次、更具分辨力的特征, 从而使方法达到较高精度的效果.而传统的机器学习分类方法虽然也具有较强的学习能力, 但不具备自动挖掘深层特征的能力, 因此预测效果较差.

表5 各方法的实验结果对比 Table 5 Prediction result comparison of different classification algorithms %

基于不同深度学习方法构建不同的预测模型, 得到分类结果.对于基于时间窗的预测性能评估, 使用MLP分类结果与LSTM作为后端分类器都表现较差.对于基于事件的性能评估, MLP的误报率较高.这是因为MLP的学习过程旨在更新网络参数, 在不从输入数据中提取任何特征的情况下, 输出更接近实际情况.而相比MLP, 单向LSTM能保留时间序列上的有效信息, 达到较优的预测结果[19].但相比单向LSTM, Bi-LSTM在处理时间序列基础上能接收序列的上下文信息内容, 存储更深层次、更具有分辨力的特征[1, 5, 25].

为了进一步评估本文方法, 将取得的实验结果与文献[2]方法进行对比, 结果如表6所示.文献[2]利用不同的谱功率特征构成特征向量, 分别为绝对功率谱、相对功率谱和功率谱比.谱功率特征是一种只描述信号瞬时频率而不考虑时间变化的频域特征.频域特征具有理想性的假设, 不能得到令人信服的结果.Sharma等[26]认为时频域的特征能达到更优的预测效果, 时频域特征能较好地描述信号的时间变化和频率瞬态变化, 适用于EEG等非平稳非线性信号.

表6 基于相同头皮脑电数据集的癫痫发作预测方法的实验结果对比 Table 6 Comparison of experimental results of epileptic seizure prediction methods on same scalp EEG dataset %

此外, 文献[2]利用2种特征选择方法对混合特征向量(Hybrid Spectrum Power, HSP)进行选择, 不仅增加计算负担, 而且在处理新的病人数据库时, 要求处理者具备足够的特征工程知识和专业知识, 最后, 采用SVM作为分类器, 结合LOOCV对发作前期和发作间期特征进行分类判别.本文方法利用深度学习工程执行特征选择和分类过程, 不需要人为地仔细提取和选择用于预测任务的最佳特征并完成分类.

另外, 由表6可看出, 文献[2]只关注基于事件的分类性能, 而忽略基于时间窗的分类性能, 但基于时间窗的性能也被广泛应用于验证和检验癫痫预测方法的有效性.本文同时评估基于时间窗和基于事件的分类性能, 不仅具有较高的ACC、SEN和SPEC, 而且相比文献[2], FAR值降低2.11%.因此, 本文方法具有较精准的预测效果, 可降低睡眠中癫痫发作预测的FAR.

3 结束语

在现有基于EEG信号的癫痫预测方法中, 少有研究关注如何预测睡眠中发生的癫痫.睡眠中的癫痫发作比清醒时更难及时抢救, 这可能导致患者患多种并发症甚至猝死的概率增加[2].本文提出基于深度神经网络的个性化睡眠癫痫发作预测方法.首先, 原始数据以0.5~32 Hz的频率进行滤波, 并以长度为4 s滑动窗进行分段, 确保在短时间内触发报警.再使用db4离散小波变换分解信号并提取统计特征.然后, 由Bi-LSTM结合LOOCV完成模型训练过程.最后经过决策的后处理过程, 将连续窗口的预测结果进行限制, 旨在减少误报率, 优化预测结果.今后, 需要更多的数据进一步证实本文方法的预测能力, 也致力于将这种方法应用于其它一些可通过睡眠脑电图信号识别的脑部疾病, 如帕金森综合征等.

参考文献
[1] SHOEIBI A, GHASSEMI N, KHODATARS M, et al. Epileptic Seizure Detection Using Deep Learning Techniques: A Review[C/OL]. [2020-06-26]. https://arxiv.org/pdf/2007.01276.pdf. [本文引用:6]
[2] 刘伟楠, 刘燕, 佟宝同, . 基于功率谱的睡眠中癫痫发作预测. 生物医学工程学杂志, 2018, 35(3): 329-336.
(LIU W N, LIU Y, TONG B T, et al. Prediction of Seizures in Sleep Based on Power Spectrum. Journal of Biomedical Engineering, 2018, 35(3): 329-336. ) [本文引用:9]
[3] YANY J, SAWAN M. From Seizure Detection to Smart and Fully Embedded Seizure Prediction Engine: A Review. IEEE Transactions on Biomedical Circuits and Systems, 2020, 14(5): 1008-1023. [本文引用:1]
[4] RASHEED K, QAYYUM A, QADIR J, et al. Machine Learning for Predicting Epileptic Seizures Using EEG Signals: A Review[J/OL]. [2020-06-26]. https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9139257. [本文引用:1]
[5] DAOUD H, BAYOUMI M A. Efficient Epileptic Seizure Prediction Based on Deep Learning. IEEE Transactions on Biomedical Circuits and Systems, 2019, 13(5): 804-813. [本文引用:11]
[6] TIAN X B, DENG Z H, YING W H, et al. Deep Multi-view Feature Learning for EEG-Based Epileptic Seizure Detection. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2019, 27(10): 1962-1972. [本文引用:4]
[7] GHAYAB H R A, LI Y, SIULY S, et al. A Feature Extraction Technique Based on Tunable q-Factor Wavelet Transform for Brain Signal Classification. Journal of Neuroscience Methods, 2019, 312: 43-52. [本文引用:1]
[8] PARVEZ M Z, PAUL M. Epileptic Seizure Prediction by Exploiting Spatiotemporal Relationship of EEG Signals Using Phase Correlation. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2016, 24(1): 158-168. [本文引用:1]
[9] POLAT K, GÜNES S. Classification of Epileptiform EEG Using a Hybrid System Based on Decision Tree Classifier and Fast Fourier Transform. Applied Mathematics and Computation, 2007, 187(2): 1017-1026. [本文引用:2]
[10] XU J C, ZHENG H, WANG J H, et al. Recognition of EEG Signal Motor Imagery Intention Based on Deep Multi-view Feature Learning. Sensors, 2020, 20(12): 3496-3502. [本文引用:1]
[11] 钟伯成, 吴小培. 基于小波变换的脑电信号瞬态特征提取. 模式识别与人工智能, 2000, 13(2): 218-221.
(ZHONG B C, WU X P. A Method Based on Wavelet Transform for Taking Instantaneous EEG. Pattern Recognition and Artificial Intelligence, 2000, 13(2): 218-221. ) [本文引用:1]
[12] AILENI R M, PASCA S, FLORESCU A. EEG-Brain Activity Monitoring and Predictive Analysis of Signals Using Artificial Neural Networks. Sensors, 2020, 20(12): 3346-3351. [本文引用:2]
[13] ASSI E B, NGUYEN D K, RIHANA S, et al. Towards Accurate Prediction of Epileptic Seizures: A Review. Biomedical Signal Processing and Control, 2017, 34: 144-157. [本文引用:1]
[14] OZDEMIR N, YILDIRIM E. Patient Specific Seizure Prediction System Using Hilbert Spectrum and Bayesian Networks Classifiers. Computational and Mathematical Methods in Medicine, 2014. DOI: 10.1155/2014/572082. [本文引用:1]
[15] OSMAN A H, ALZAHRANI A A. New Approach for Automated Epileptic Disease Diagnosis Using an Integrated Self-Organization Map and Radial Basis Function Neural Network Algorithm. IEEE Access, 2019, 7: 4741-4747. [本文引用:1]
[16] TSIOURIS K M, PEZOULAS V C, ZERVAKIS M, et al. A Long Short-Term Memory Deep Learning Network for the Prediction of Epileptic Seizures Using EEG Signals. Computers in Biology and Medicine, 2018, 99: 24-37. [本文引用:5]
[17] ZHANG H T, WU D P, ZHANG R Y, et al. Incremental Learning System for Disease Prediction: Epileptic Seizure Case // Proc of the IEEE Global Communications Conference. Washington, USA: IEEE, 2018. DOI: 10.1109/GLOCOM.2018.8647373. [本文引用:1]
[18] RAJENDRA A U, FAUST O, KANNATHAL N, et al. Non-linear Analysis of EEG Signals at Various Sleep Stages. Computer Me-thods and Programs in Biomedicine, 2005, 80(1): 37-45. [本文引用:2]
[19] RUKHSAR S, KHAN Y U, FAROOQ O, et al. Patient-Specific Epileptic Seizure Prediction in Long-Term Scalp EEG Signal Using Multivariate Statistical Process Control. IRBM, 2019, 40(6): 320-331. [本文引用:3]
[20] JIANG Z B, CHUNG F L, WANG S T. Recognition of Multiclass Epileptic EEG Signals Based on Knowledge and Label Space Inductive Transfer. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2019, 27(4): 630-642. [本文引用:1]
[21] 何清, 李宁, 罗文娟, . 大数据下的机器学习算法综述. 模式识别与人工智能, 2014, 27(4): 327-336.
(HE Q, LI L, LUO W J, et al. A Survey of Machine Learning Algorithms for Big Data. Pattern Recognition and Artificial Intelligence, 2014, 27(4): 327-336. ) [本文引用:1]
[22] CHEN S E, ZHANG X, CHEN L L, et al. Automatic Diagnosis of Epileptic Seizure in Electroencephalography Signals Using Nonli-near Dynamics Features. IEEE Access, 2019, 7: 61046-61056. [本文引用:1]
[23] GOLDBERGER A L, AMARAL L A N, GLASS L, et al. PhysioBank, PhysioToolkit, and PhysioNet: Components of a New Research Resource for Complex Physiologic Signals. Circulation, 2000, 101(23): 2015-2020. [本文引用:1]
[24] PARK Y, LUO L, PARHI K K, et al. Seizure Prediction with Spectral Power of EEG Using Cost-Sensitive Support Vector Machines. Epilepsia, 2011, 52(10): 1761-1770. [本文引用:1]
[25] 陈文实, 刘心惠, 鲁明羽. 面向多标签文本分类的深度主题特征提取. 模式识别与人工智能, 2019, 32(9): 785-792.
(CHEN W S, LIU X H, LU M Y. Feature Extraction of Deep Topic Model for Multi-label Text Classification. Pattern Recognition and Artificial Intelligence, 2019, 32(9): 785-792. ) [本文引用:1]
[26] SHARMA M, SHAH S, ACHUTH P V, et al. A Novel Approach for Epilepsy Detection Using Time-Frequency Localized Bi-orthogonal Wavelet Filter. Journal of Mechanics in Medicine and Biology, 2019, 19(1). DOI: 10.1142/S0219519419400074. [本文引用:1]