利用深度循环神经网络对心电图降噪

具体的软硬件实现点击 http://mcu-ai.com/ MCU-AI技术网页_MCU-AI
我们提出了一种利用由长短期记忆 (LSTM) 单元构建的深度循环神经网络来降 噪心电图信号 (ECG) 的新方法。该网络使 用动态模型 ECG 生成的合成数据进行预训 练,并使用来自 Physionet PDB 心电图信 号数据库的真实数据进行微调。结果表 明,10层DRNN对于幅值0.2mV白噪声的 真实信号去噪均方误差低至0.179,使其成 为其他常用方法的可行替代方案。我们还 研究了合成数据对真实信号网络性能的影 响。我们的结果表明,无论训练集大小如 何,使用合成数据预训练的网络比仅使用 真实数据训练的网络具有更好的结果。我 们建议通过迁移学习框架和人类认知过程 的类比来解释这一点。

心电图 (ECG) 是一种记录心脏随时间变化 的电活动的过程。测量是通过连接到患 者身体的电极和称为心电图仪的医疗设备来 完成的。如今,通常使用 10 个电极,放置 在胸部和四肢上。对于 10 电极测量,心电图包含 12 个波形,每个 测量角度一个波形,称为"导联"。每个心 电图波形都是一个准循环时间序列。波形上的每个准周期代表一个 心动周期,因此其典型频率在 60 - 100 bpm 之间。周期本身具有称为 P、Q、R、 S、T 的特征组件,对应于心动周期中的特 定事件。其中三个:Q、R 和 S 形成所谓的 QRS 复合体。

ECG 信号容易受到各种噪声的影响,具体有:

电源线干扰 - 产生 60 或 50 Hz 的随 机分量,具体取决于电源频率。

电极接触噪声 - 由身体和电极之间的不当 接触引起。

运动伪影 - 由患者的运动 产生,影响电极-皮肤阻抗,导致 100-500 ms 长的失真。

肌肉收缩 - 肌肉活动产生常规峰峰值 ECG 幅度的 10% 的噪声,频率高达 10 kHz。持续 时间通常约为 50 毫秒。

基线漂移 - 由呼吸活动引起。此噪声的幅度约为心 电图幅度的 15%。

心电图数据去噪是一个已知问题,因此存在多种技术,如下:

滤波技术,IIR 陷波滤波器,FIR 滤波,自适应滤波器。

离散小波变换 (DWT)。

仿生小波变换 ( BWT)。

过滤残差 (FR) 方法。

经验模态分解 (EMD)。

近年来,人们可以观察到利用机器学习方法和神 经网络进行信号过滤的新尝试的出现。它们可以 作为一种特定类型的自适应方法放置在分类法之 上。Moein 研究了用于 ECG 噪声消除的多 层感知器网络。为了进行训练,使用了包含 100 个信号样本的相对较小的数据集。预期的输出是通过使用卡尔曼滤波器对输入信号进 行降噪而产生的。测试集由 20 个样本组 成。网络的错误率全部低于 0.5。然而,值 得注意的是,由于数据集的性质,网络学会 了模拟卡尔曼滤波。因此,通过这种方式训 练网络,无法获得比卡尔曼滤波本身更好的 性能。本文介绍了一种利用深度递归神经网络 (DRNN)对 ECG 信号进行降噪的新方 法。该网络使用两个合成数据集和一个真实 数据进行训练。我们还研究了使用合成数据 集如何影响网络性能。

我们建议使用深度循环去噪神经网络(DRDNN) 对心电图信号进行去噪。它们是一种深度循环神经 网络(DRNN),因此具有两个不同的特征。第 一个是它们由堆叠在一起的多个 (> 2) 层组成 - 这 种方法也称为深度学习。这种深层架构虽然比典型 的"浅层"神经网络需要更多的计算能力,但事实证明,它们在各种应用中非常有效,因为 它们能够学习数据的分层表示,初始层学 习"简单"特征,而下一层学习更复杂的概 念。有趣的是,人们仍然不知道为什么深层神 经网络比浅层神经网络更有效。 DRNN(以及一般所有递归神经网络)的第二 个显着特征是它们随着时间的推移保留其内部 状态的能力。它通常是通过在网络中引入循环 连接来获得的,该连接将神经元的先前输出返 回到其自身和/或同一层中的其他单元。这使得 它们成为涉及序列和时间序列的处理或预测的 机器学习任务的常见选择。深度 RNN 的流 行架构涉及称为长短期记忆(LSTM)单元的 特定类型的构建块。顾名思义,它们会长 时间或短期地记住其内部状态。LSTM 单元可以通过以下方式连接成更大的结构。第一个是将单元存储器 的输出和一个单元的隐藏门连接到遗忘门的输 入和输出,从而形成单个 LSTM 层。然后可以 通过将一层的输入连接到下一层的输出来堆叠 这样的层。这允许构建多层、深度 LSTM 网 络。LSTM 网络的输入信号一次应用一个样 本。然后将其传播到每一层并在每次迭代中产生一个输出。因此,通过应 用相同长度的输入可以获得N长度的输出信 号。这对于像我们这样的去噪目的来说非常 好,但是对于预测任务的分类来说,信号需 要"平坦化"是毫无价值的。因此,许多基于 DRNN 的架构还包含一定数量的前馈层。 LSTM 网络可以使用时间反向传播 (BPPT) 及 其变体进行训练。该算法的工作原理与经 典反向传播类似,但在循环网络的展开结构上 运行。这是有效的,因为每个循环网络都可 以"展开"为等效的前馈网络。损失函数计算 为序列中所有时间步长的平均成本。在本文 中,我们使用深度循环去噪神经网络,它是 DRNN 和去噪自动编码器的特定混合体。具体结构如下图:

为了生成合成训练数据,我们使用Patrick E. McSharry, Gari D. Clifford, LionelTarassenko, and Leonard A. Smith,提出的"生成合成心电图信号的动态模型"。它允许根据信号的统计特性生成真实 的心电图信号,例如心率的平均值和偏差或低/高频率功率比。此外,该模型还包含一组可以 指定的 P、Q、R、S 和 T 事件的形态参数。 最后,可以定义生成信号的测量参数,如信 号采样频率和测量噪声。该模型由一组三个 微分方程描述:

要在实践中使用模型,需要指定几个参数。 这里的主要目标是获得尽可能类似于真实数 据的信号。为每个P、Q、R、S和T事件设置 形态参数(ai、bi、Qi),除了心率标准偏差-使用值5。此外,使用的采样 率为512。信号具有振幅为0.01的加性均匀 (白)噪声。它被视为"基本"噪声水平 - 与后来为降噪任务添加的噪声水平不同。生 成的合成信号的示例如下图所示。

测试是为了回答两个问题:DRNN对于心电图去噪的有效 性如何数据以及使用合成数据进行预训练是否(以及如 何)影响网络性能。使用了两个 ECG 信号数据 集,第一个包含 4000 个合成序列,第二个包含 4000 个真实序列。真实数据集来自Physionet PTB诊断数据库。数据库中的信号可用于 15 个导联 - 我们决定仅使用 aVL 导联,因为它被认 为是诊断方面最多的一个 。综合数据集是使 用上一节中描述的动态模型生成的。两个数据集 中的信号都被分成 300 个样本长的序列,因此总 共使用了 240 万个数据样本。通过将信号归一化 至零均值来对信号进行预处理。这些预处理的数 据集在网络训练和测试期间用作预期输出。网络 的输入信号是通过向参考信号添加幅度为0.2 mV 的白噪声来产生的。在第一次测试中,使用合成 数据训练了11个RNN,其中75%用作训练集, 25%用作验证集放。该网络由不同数量的隐藏 LSTM 层组成 - 从 0 到 10。训练算法是随时间变 化的自适应动量方法 (Adam),批量大小为 256。 训练持续 20 个 epoch。训练集和验证集的损失函 数都是均方误差。较深的网络通常比浅层网络表现更好,特 别是与没有任何 LSTM 层的网络(最左边的条) 相比。表现最好的网络是最深的网络,由 10 个 LSTM 层组成,它获得了最小的训练和验证损 失,均等于 0.0033。非常有趣的是,即使没有进 一步微调,网络也能够对真实数据进行去噪。例 如,最深的网络在真实信号的测试数据集上获得 了 0.190 MSE。

结果表明,DRDNN可用于心电信号的有效去 噪,均方误差低至0.179。因此,这是深层网络 相对于浅层架构表现出优越性的另一个领域。 然而,层数的增加会导致网络过度拟合的风 险。可以使用深度学习的正则化技术来克服这 个问题,调整超参数可能会获得比本文更好 的性能。另一个重要的结论来自于合成训练数 据对网络性能影响的分析。结果表明,使用人 工数据训练的网络比仅使用真实信号训练的网 络具有更好的性能。这可以通过"迁移学 习"框架解释训练过程来部分解释。它是 一种流行的深度学习技术,允许使用与目标数 据不同的域、分布和任务的训练数据来训练网 络。该网络可以通过相对少量的微调应用于目 标任务。迁移学习用人类学习过程的类比来解 释:人们可以使用以前获得的知识更快地解决 问题,即使这些知识是为了不同的目的而获得 的领域。这解释了使用合成心电图数据训练的网 络也能够对真实信号进行去噪。

在网络训练方面,合成心电图数据基于某 种数学模型。根据定义,模型是更复杂事物的 更简单视图。在我们的例子中,心电图信号模 型是一个相当简单的模型,不包括许多生物和 电物理现象。此外,它假设了一个非常简单的 噪声模型。然而,它比真实数据更容易学习。 因此,经过合成数据训练的网络能够更快地了 解心电图信号的"本质",并利用这些知识从 真实数据中学习。这意味着使用人工训练数据 不仅在数据短缺的情况下(医学领域经常出现 这种情况)是一种有前途的方法,而且还可以 利用数据数学模型中包含的先验知识来提高网 络的质量。

posted @ 2024-05-15 14:39  mcu-ai-com  阅读(103)  评论(0编辑  收藏  举报