基于EEMD-SE和栈式降噪自编码网络的局部放电模式识别

2021-09-15 11:45张金水薛乃凡
计算机应用与软件 2021年9期
关键词:模式识别电信号编码器

张金水 蒋 伟 薛乃凡

(上海电力大学电子与信息工程学院 上海 200090)

0 引 言

电气设备的可靠性与电网的安全运行密切相关。局部放电是造成电气设备绝缘劣化的主要原因,也是绝缘劣化的重要征兆和表现形式[1]。由于电气设备内部产生局部放电现象的原因有多种,其对外表现的形式也存在一定的差异[2],常见的局部放电类型有电晕放电、沿面放电、悬浮放电和气隙放电等[3]。局部放电状态检测是保障高压设备可靠运行的重要手段,而局部放电模式识别是局放检测的核心环节[4]。因此,对局部放电信号进行准确分类,现已成为电气设备故障诊断中的重要部分。

国内外学者对局部放电模式识别的深入研究已经取得了一定的成果。陈新美等[5]提出了一种基于朴素贝叶斯的局部放电诊断模型,朴素贝叶斯分类器要求数据有完全的独立性,这一点在很多情况下都难以满足。宋辉等[6]提出了一种大数据背景下通过匹配数据库的方法,构建出适用于放电数据的变分贝叶斯自编码器的网络模型,取得了较好的效果,但对于变分模态分解的重要影响参数值的选择并未作出说明。龙嘉川等[7]引入新的频域窗宽度计算公式,对标准S变换做改进后再提取特征进行分类,在未去噪的情况下,仍具有良好的鲁棒性,但改进的S变换只适用于超高频局部放电信号,对放电信号有一定的约束。高佳程等[8]提出了一种基于二维变分模态分解和Hilbert的特征提取方法,并将三层BP神经网络作为分类器,但BP神经网络属于传统神经网络,需要大量的样本训练,而且容易出现过拟合等问题。贾勇勇等[9]针对传统特征提取主观性过强、准确性和鲁棒性较差等问题,提出了基于深度残差网络的模式识别方法,该方法能够自适应提取特征,且有较高的准确率和鲁棒性,但仍存在PRPD数据无法体现气隙放电特征导致的气隙放电信号的识别效果较差的问题。

集合经验模态分解EEMD是由Wu等[10]提出的一种完全自适应信号的时频分析方法,相比小波变换等算法,EEMD不需要预先设定基函数,且对局部放电该非线性非平稳信号有独特优势。若将EEMD与样本熵SE相结合可以有效解决EEMD分解后产生的高维特征数据问题,同时保留原始数据的时频特性。因此,本文将EEMD和SE结合,提出一种应用于局部放电模式识别信号特征提取的新方法,并利用栈式降噪自编码器SDAE对局部放电信号进行分类识别。同时,本文对局部放电信号分别进行EMD-SE、SE和EEMD-AE时频分析,对比分析了结果。此外,本文还与传统分类器,如反向传播BP神经网络和支持向量机SVM等进行了对比分析。实验结果表明,本文方法具有较高的可行性与有效性。

1 EEMD-SE基本原理

1.1 集合经验模态分解

EEMD是一种噪声辅助数据分析方法,具有自适应性和完备性,而且有效克服了经验模态分解(Empirical Mode Decomposition,EMD)中由间歇性高频分量等因素造成的模态混叠等问题[11]。其原理是利用高斯白噪声频谱均匀分布的统计特性,在原始信号中加入不同的白噪声,使得信号在不同尺度上具有连续性[12],再对信号进行EMD分解,从而消除模态混叠。EEMD实现过程如下:

(1) 将高斯白噪声ni(t)加入到原始信号x(t)中,得到信号Xi(t);(2) 对信号Xi(t)进行EMD分解,得到N个固有模态函数(Intrinsic Mode Function,IMF)和一个残余分量ri(t);(3) 重复步骤(1)和步骤(2),但每次步骤(1)中加入的高斯白噪声幅值都不相同,重复M次;(4) 将M次得到的IMFi(t)和ri(t)分别做集成平均处理后得到最终的IMF(t)。

1.2 样本熵

样本熵是基于近似熵提出的一种新的度量时间序列复杂度的方法[13],具有抗噪声、抗干扰力强和一致性好等特点[14]。其计算步骤如下:

(1) 给定维数m和相容极限r等参数,并由原始数据{x(n)}={x(1),x(2),…,x(N)}重构m维向量{X(n)}={X(1),X(2),…,X(N-m+1)},其中:

X(i)=[x(i),x(i+1),…,x(i+m-1)]

(1)

(2) 计算Xm(i)与Xm(j)的距离,即:

d=Max(|x(i+k)-x(j+k)|)k=0,1,…,m-1

(2)

(3) 对给定的Xm(i),统计Xm(j)的数目Bi,且满足Xm(i)与Xm(j)的距离d≤r。

(3)

(5) 同样计算当维数为m+1时的A(m)(r)。

(6) 得出样本熵:

(4)

根据Pincus[15]的研究,同时为了使样本熵具有更好的统计特性,本文取m=2,r=0.2×std,其中std为原始数据的标准差。

2 自编码器

2.1 降噪自编码器

自编码器(Autoencoder,AE)以无监督算法逐层训练和优化系统参数,从无标签的原始数据中提取高维复杂输入数据的分层特征[16]。为了确保AE提取特征的有效性,在该基础上Vincent等[17]提出了降噪自编码器(Denoising Autoencoder,DAE),让DAE学习加入噪声后“破坏数据”之间的深层关系,再恢复出原始输入数据,确保了网络的良好鲁棒性。DAE的原理如图1所示。

图1 DAE原理结构图

对输入数据x进行加噪“破坏”,或是加入噪声或是丢弃数据得到数据x′,经过函数F编码为y,再由函数G解码为z,z即数据x的重构,最后计算输入数据x和重构数据z的重构误差。

2.2 栈式降噪自编码器

SDAE是Vincent等[18]提出的,多个降噪自编码器构成的一种深度学习网络,每一个DAE的输出作为下一个DAE的输入,直至连至输出分类层。SDAE前向训练各层参数时属于无监督学习,当前向训练结束后,采用传统的BP算法进行有监督的训练[19],对整个网络系统进行微调,进而提取更深层次、更具有表征力的数据特征。SDAE结构图如图2所示。

图2 SDAE原理结构图

3 方法设计

针对局部放电信号微弱性、复杂性及非平稳性的特点,本文首次提出了一种应用于局部放电模式识别的基于EEMD-SE和栈式降噪自编码器的方法。首先将局部放电信号经EEMD分解成多个IMF,分别对分解出的IMF求取样本熵,构造出每个放电类型的特征向量,将放电类型的特征向量输入SDAE进行训练,最后将测试样本送入训练好的SDAE模型,完成局部放电信号的模式识别。其模式识别流程如图3所示。

图3 局部放电模式识别流程

模式识别具体算法实现步骤如下:

步骤1给定添加的高斯白噪声的标准差Nstd和添加次数NE,对信号进行EEMD分解。由文献[10]可知,当Nstd=0.2,NE=100时,EEMD对信号分解有较好效果。

步骤2给定m=2,r=0.2×std,对步骤1分解得到的IMF分量求取样本熵,并作为每个放电类型的特征向量。

步骤3搭建SDAE网络。本文中搭建了一个结构为100-50-20-4的SDAE网络,即三个DAE堆叠而成。采用KFold交叉验证,步骤2求取的样本熵作为输入,对网络进行训练和测试。

4 实 验

4.1 数据采集

本文实验以脉冲电流法,构造了气隙放电、沿面放电、电晕放电和悬浮放电四类放电缺陷类型。采集每种放电类型100个样本共400个样本,各类放电信号波形如图4所示。

(a) 沿面放电信号波形图

(b) 气隙放电信号波形图

(c) 电晕放电信号波形图

(d) 悬浮放电信号波形图

4.2 特征提取

对放电样本进行EEMD-SE分析处理,即首先利用EEMD对样本信号分解,然后计算各IMF相应的样本熵,构造出局部放电缺陷类型的特征向量。其中沿面放电信号的EEMD分解如图5所示。部分训练集的样本熵如表1所示,表中的标签1-标签4分别表示沿面放电、气隙放电、电晕放电和悬浮放电。

图5 沿面放电信号的EEMD分解图

表1 训练集样本熵

由图5沿面放电信号的EEMD分解可以看出,该放电信号分解为了9个IMF,即9个IMF叠加后可以完全恢复出原始沿面放电信号。对分解得到的IMF分量进行主成分分析,其中IMF1的贡献率高达96.469 0%,IMF2贡献率为2.333 4%,IMF3贡献率为1.050 2%,IMF4贡献率为0.097 5%,IMF5贡献率为0.047 7%,即前5个IMF分量已足以表征原始放电信号的特征,又考虑到太多IMF会影响网络模型训练的速度,同时也为了减少实验计算的复杂度,所以本实验中选取前5个IMF的样本熵作为输入。

4.3 模式识别与分类

作为深度学习的一种,栈式降噪自编码器具有很强的特征提取能力,且有良好的鲁棒性。实验中随机选取340个样本作为训练集,60个样本作为测试集,且训练集与测试集数据不重叠。部分测试集的样本熵如表2所示,测试结果如图6所示。

表2 测试集样本熵

续表2

图6 局部放电测试集识别分类结果

可以看出,60个测试样本中只有1个样本判别出错,识别准确率为98.33%,充分验证了本文方法能够有效提取局部放电信号的特征量,并取得良好的识别效果。

为进一步验证EEMD-SE算法在局部放电模式识别中的可行性与优越性,分别以EEMD-SE、EMD-SE、EEMD-AE和信号本身SE四种方法提取局部放电信号的特征,并对SDAE进行训练和分类测试,对比结果如表3所示。

表3 不同特征提取方法识别准确率比较

由表3可知,基于EEMD-SE的特征提取方法得到局部放电模式识别准确率最高。由于EMD采用递归式分解,而且每次分解会将包络线估计误差传递给下次分解,且放电信号中或有噪声或有间歇信号,导致出现模态混叠,影响了识别的准确率[20]。同时,EEMD-SE方法得到的识别准确率高于EEMD-AE,因为SE相比AE有更强抗噪声能力,有更好的鲁棒性,故有更高的识别率。

同时为进一步说明SDAE在处理高维大容量数据的特征提取和模式识别上的优势,以EEMD-SE方法提取的放电信号特征作为特征向量,分别送入BP神经网络(BPNN)、SVM、DAE和SDAE四种分类器,其对比结果如表4所示。

表4 不同分类器放电信号识别准确率比较

可以看出,SDAE网络具有最好的识别效果。BPNN识别效果最差,这是因为BPNN作为传统的浅层网络其自身在处理高维大容量数据时极易产生不收敛、过拟合等问题[21]。SVM本身作为一个二分类器,其在处理多分类时较为复杂,耗时久,效果表现一般。相较于DAE,SDAE仍有较高的识别准确率,体现了SDAE深度神经网络提取更深层特征的优秀能力。

综合分析上述结果,相比于其他时频特征提取算法和传统分类器,基于EEMD-SE和SDAE的方法在局部放电模式识别中有较高的识别准确率和较强的鲁棒性,充分验证了该方法的可靠性和有效性。

5 结 语

通过分析实验条件下的局部放电信号,本文首次将EEMD-SE算法和栈式降噪自编码器运用到局部放电模式识别中,以EEMD-SE提取的放电信号特征作为输入,以栈式降噪自编码网络作为分类器,实现了四类局部放电信号的分类识别,并得到以下结论:

(1) 首次将EEMD和样本熵相结合的方法应用于局部放电模式识别,相较于信号本身的SE和基于EMD-SE、EEMD-AE的方法,本文方法能更有效地提取出放电信号的特征向量,且具有更高的放电类型识别准确率。

(2) 在放电信号样本训练及识别过程中,相同网络结构下,栈式降噪自编码网络比BP神经网络和SVM具有更强的泛化能力和更高的正确识别率。且相比单层的DAE,深层SADE网络具有更好的放电信号特征提取能力。

(3) 实验结果表明,本文方法能有效地提取局部放电信号的特征并快速正确地进行模式识别分类,且获得较好的分类精度,为局部放电模式识别技术提供较为实用的解决方案。

猜你喜欢
模式识别电信号编码器
WV3650M/WH3650M 绝对值旋转编码器
轻身调脂消渴片的指纹图谱建立、化学模式识别及含量测定
I、II类单点故障模式识别与质量管控浅析
基于窗函数法的低频肌电信号异常分类仿真
设定多圈绝对值编码器当前圈数的方法
基于单片机的心电信号采集系统设计
转炉系统常用编码器选型及调试
舞台机械技术与设备系列谈(二)
——编码器
基于Code Composer Studio3.3完成对心电信号的去噪
汽车外观造型创新设计遗传算法的应用