基于PRPD图谱多特征融合的局部放电类型识别研究

2022-07-02 05:12代少升赖智颖刘小兵
关键词:识别率图谱卷积

代少升,任 忠,赖智颖,刘小兵

(重庆邮电大学 通信与信息工程学院,重庆 400065)

0 引 言

变压器对电力系统运行非常重要,如果出现故障,将造成不可估量的经济损失[1]。变压器在生产、制造、安装、运行过程中容易产生绝缘缺陷,导致设备内电场发生畸变,从而产生局部放电现象(partial discharge, PD)[2]。变压器内部绝缘缺陷形式多种多样,不同放电类型在绝缘劣化机理、表现形式方面有一定的差异,对设备安全运行的影响以及绝缘状态的危害程度也不尽相同[3]。局部放电类型识别可以为变压器的诊断、检修以及放电源定位提供依据,保障电力系统的安全稳定运行[4]。

变压器设备中的局部放电通常分为4种典型放电类型:尖端放电缺陷、空穴放电缺陷、悬浮电位放电缺陷和自由金属颗粒放电缺陷。对局部放电类型识别的研究基本分3个步骤:局部放电模式构造、局部放电特征提取以及分类器设计[5]。

局部放电相位分布(phase resolved partial discharge,PRPD)分析模式具有数据量小,稳定性好,对监测条件要求较低且监测信号相对较少的优点,在实际中得到广泛的应用[6-8]。在局部放电特征提取方面,主要使用的方法有统计特征法[9]、图像矩特征参数法[10]、分形特征法[11]以及小波变换法[12]等。其中,统计特征是基于PRPD图谱提取的,因其物理意义明确,且方法比较简单,因而被广泛使用。在分类器选择方面,局部放电类型识别已有大量的研究成果,其中以反向传播神经网络(back propagation neural network, BPNN)[13-15]和支持向量机(support vector machine, SVM)[16-17]的应用较为广泛,并且取得了较好的分类效果。但是传统的BPNN以及SVM分类方法在特征参数选取上存在一定的主观性,通常依赖于专家经验,信息丢失严重,缺乏一定的泛化性,从而导致识别率不高[18]。

近年来,深度学习理论在图像识别领域得到了广泛的应用[19]。2016年,武汉大学张新伯等[20]采用深度置信网络进行气体绝缘组合电器(gas insulated combined electrical appliance,GIS)局部放电模式识别,并将识别结果与SVM和BPNN进行对比,总体识别率明显提高且用时大幅缩短。2018年,文献[21]将PNN(probabilistic neural network)应用于变压器局部放电(partial discharge, PD)类型识别,实验结果表明,与典型的变压器局部放电类型识别方法相比,所提方法速率有所提升且识别率较高。文献[22]将卷积神经网络(convolutional neural network, CNN)用于局部放电时域波形图像模式识别,识别效果大幅优于基于统计特征的SVM和BPNN。

目前,局部放电在线监测系统显示多为PRPD图谱形式,针对于CNN在图像识别领域比较成熟,本文提出一种多特征融合卷积神经网络识别算法,该算法对传统CNN进行改进,在利用CNN有效挖掘PRPD图谱图像特征的同时,提取PRPD图谱的统计特征参数,并进行多特征融合,最大限度地避免特征信息的丢失,最后将融合特征输入到分类器进行分类输出结果,提高识别率。为证明算法的有效性,将本文局部放电类型识别方法与传统浅层分类器SVM和BP神经网络以及未融合特征的CNN进行了比较,结果表明,本文方法在识别准确率上大幅优于SVM和BP神经网络,并且较未融合特征的CNN也有所提升。

1 局部放电数据获取及特征构建

1.1 局部放电缺陷类型设计

本文实验与某电力公司合作,设计了4种典型的变压器局部放电缺陷模型,如图1所示。使用该公司的局部放电检测设备对每种类型缺陷进行在线检测取样,用于后面提取特征并识别。模型电极均为高强度合金,外壳为绝缘材料。

图1 4种典型局部放电缺陷模型Fig.1 Four typical partial discharge defect models

1)尖端放电(见图1a)。采用针板电极模型,在高压电极端附加一根金属针,用来模拟产生尖端放电。

2)空穴放电(见图1b)。在高压端附加一个金属球电极,地电极与球电极之间通过两层环氧板包裹一小块绝缘空穴区域,产生空穴放电。

3)悬浮电位放电(见图1c)。在高压电极端附加一个金属铝饼,并由绝缘支柱连接到地电极,从而产生悬浮电位放电。

4)自由金属颗粒放电(见图1d)。通过在高压电极与地电极之间放置一碗状结构,结构中放置几个铝球,模拟产生自由金属颗粒放电。

1.2 局部放电实验原理图

在实验室环境中,依次安装每种缺陷模型,利用局部放电实验电路,采用逐步升压的方式产生放电,并用UHF传感器采集信号送入高速信号处理板进行处理,并保存每种缺陷的信号数据,如图2所示。

图2 局部放电实验电路Fig.2 Partial discharge experimental circuit

1.3 特征构建

1.3.1 PRPD图谱特征

PRPD图谱是描述若干个周期内,局部放电的放电次数N、放电量Q以及对应的放电相位P(0°~360°)的关系而形成的。本实验中PRPD图谱为连续采集1 min PD信号,构建的二维图谱样本,其中横坐标表示放电相位P,纵坐标表示放电量Q,而放电次数N则映射到颜色空间上,每个分部位置的N值统计叠加,可以做到颜色标识,根据累积的次数分为6个颜色级别,颜色由浅到深,每种颜色及其RGB值都是对应的,具体对应规则如表1所示,实验测得4种典型缺陷的PRPD图谱如图3所示。每类绝缘缺陷在放电电压区间内测得500个样本,其中训练样本400个,测试样本100个。

表1 放电次数与颜色的对应关系Tab.1 Corresponding relationship between discharge times and color

通过实验过程可知,尖端放电缺陷大部分情况是在正半周或者负半周呈现单极性谱图,随着信号幅值增大,逐步会呈现双极性谱图,但是其中一极信号相比另一极的信号幅值明显幅值较大;空穴放电缺陷放电相位特征稳定(正负半周谱图对称稳定),放电幅值较分散(正负半周信号幅值不均等,呈现分散性大小不一);悬浮电位放电缺陷放电相位特征稳定(正负半周谱图对称稳定),放电幅值较稳定(正负半周信号幅值较均等,且信号发生时幅值较大,呈现悬浮状态),相邻放电时间间隔基本一致;自由颗粒放电缺陷放电幅值分布较广,放电时间间隔不稳定,在整个工频周期内均有放电信号分布,但具有较弱工频相位特征。当放电电压慢慢升高时,每种局部放电的PRPD图谱会慢慢变化,图3中的空穴放电和自由金属颗粒放电便是如此,图3e为放电电压较低时的空穴放电图谱;图3f为放电电压较高时的自由金属颗粒放电的图谱,两者图谱特征较接近,易被混淆。

图3 4种典型缺陷PRPD图谱Fig.3 Four typical defects PRPD map

1.3.2 统计特征

对一个周期的局部放电信号进行统计方法计算能够获取3种基本量:p(放电相位)、q(放电电量)、n(放电次数),将这3种基本量进一步处理,把一个周期的局部放电信号平均分成N个相位窗,再对每一个相位窗计算其p、q、n值,可以得到{pi},{qi},{ni}序列,这3种序列能够作为此放电信号的底层特征量。将一个工频周期的相位分为360°,开窗个数就是对相位进行划分,相位窗口个数越多,则相位精度以及对应的时间精度越高,对于脉冲信号的分辨率也越高,计算出来的统计特征参数也就越准确,但是由于硬件系统的限制,本文使用系统的开窗数为120个,即每3°为一个相位窗,如图4所示。

图4 局部放电脉冲电量及其相位角Fig.4 Partial discharge pulse electric quantity and its phase angle

一个周期的局部放电信号包括正半周、负半周2部分。对于同一类局部放电故障,由于引起局部放电的绝缘缺陷相同,所以期望不同的放电信号在正负2个半周得到的放电特性是相似的。本文主要提取局部放电的5个统计特征量,具体如下。

1)偏斜度Sk。偏斜度Sk用来描述PRPD图谱的形状差异,表示图形的偏斜程度。若偏斜度为0,图形呈对称;若偏斜度大于0,则表示图形正偏,偏斜方向位于算术平均数左侧;若偏斜度小于0,则表示图形反偏,偏斜方向位于算术平均数右侧。其具体计算公式为

(1)

(1)式中:N表示PRPD图谱半工频周期内相位开窗的个数;φi表示PRPD图谱中第i个相窗的相位;Δφ表示相位宽度;参数μ,pi和σ分别表示以φi为变量时PRPD图谱中第i个相窗内局放缺陷发生的均值、概率密度和方差,其中,y为二维图谱纵坐标,计算公式为

(2)

(3)

(4)

2)陡峭度Ku。陡峭度Ku用来描述PRPD图谱形状与正态分布相比,图谱形状分布的突起程度。若陡峭度为0,则表示图谱形状分布与正态分布一致;若陡峭度为正值,则表示图谱轮廓与正态分布相比更加尖锐陡峭;若陡峭度为负值,则表示图谱轮廓与正态分布相比更加平坦。陡峭度计算公式为

(5)

3)放电因素Q。放电因素Q能够反应PRPD图谱在正负工频半周期放电量的差异性,计算公式为

(6)

4)互相关系数CC。互相关系数CC用于描述PRPD图谱在正负工频半周形状轮廓的相似程度。若CC越接近于0,则表明图谱正负半周形状轮廓差异越大;若CC越接近于1,则表明图谱正负半周形状轮廓越相似。计算公式为

(7)

5)相位不对称度ψ。相位不对称度ψ表示统计谱图正负半周期放电起始相位的差别。计算公式为

(8)

(8)式中,φ+和φ-分别表示PRPD图谱在相位正、负半工频周期的起始放电相位。

根据上述计算得到的局部放电缺陷统计特征,可得综合统计特征向量V,计算公式为

V=(Sk,Ku,Q,CC,ψ)

(9)

2 识别方法设计

2.1 卷积神经网络

CNN是一种模拟大脑神经元分层处理输入数据的深度学习网络结构,可以对输入图像进行逐层特征提取,建立含有丰富信息的结构模型,获得更本质的抽象特征,更好地进行分类识别。典型的CNN网络结构如图5所示,由输入层、卷积层、池化层、全连接层以及输出层组成。

图5 典型CNN网络结构图Fig.5 Typical CNN network structure diagram

1)输入层。CNN的输入通常为一张图像的三维像素矩阵。长和宽代表图像的大小,高度代表图像色彩通道,黑白图片高度为1,RGB色彩图像高度为3。

2)卷积层。卷积层的卷积核可以将低层的局部区域信息通过卷积核激发到更高层次,卷积核滑动时权值共享,通过局部感知来提取图像特征。第i层卷积层输出的特征向量Hi的计算公式为

Hi=f(Hi-1⊗wi+bi)

(10)

3)池化层。池化层通过对池化窗口内的特征进行聚合统计,能减小特征图尺寸,实现数据降维。第i层第j个特征图的池化输出形式为

(11)

4)全连接层。全连接层使用卷积层和池化层的输出特征进行预测和分类。

5)输出层。输出层(Softmax层)主要在分类问题中使用。得到当前样本属于不同类型的概率分布情况。

2.2 多特征融合CNN类型识别

2.2.1 网络结构设计

为准确识别4种典型局部放电类型,论文采用多特征融合的卷积神经网络结构,如图6所示。整个网络一共8层,包括1个输入层、3个卷积层、2个池化层、1个全连接层以及1个输出分类层。输入层输入的是100×100的RGB三通道PRPD图谱,同时对图片做了一定的预处理操作,在每个通道上都减去了它的均值,并进行归一化。然后经过卷积层和池化层提取图谱特征,在卷积层选用Relu函数作为激活函数,并使用最大池化方式进行特征降维,压缩数据和参数的数量,中间加入Dropout操作防止过拟合,在全连接层加入上文提取的PRPD图谱统计特征向量V形成融合特征,最后将融合特征输入到Softmax层进行分类。PRPD图谱从颜色、纹理和形状等方面直观地反映了各类缺陷的差异,而统计特征则是对放电相位、放电量以及放电次数3个底层特征量在统计学上分布特征的描述,它描述了统计图谱的形状差异和图谱正负半周轮廓差异,融合这2种类型的特征,可以极大提高识别特征丰富度,进而增加识别率和鲁棒性。实验参数如表2所示。

图6 多特征融合CNN识别网络结构Fig.6 Multi-feature fusion CNN recognition network structure

表2 网络参数Tab.2 Network parameters

2.2.2 识别流程

基于多特征融合CNN局部放电类型识别流程如图7所示。首先使用局放检测仪采集4种典型局放缺陷PRPD图谱数据,然后对图谱进行计算出统计特征。PRPD图谱图像作为网络的输入,经过卷积池化等操作后提取出特征参数,并在全连接层将统计特征向量进行融合,随后进行训练。将数据集分为训练集和测试集,其中训练集占80%,测试集占20%,将训练集输入到网络中进行网络模型训练,采用交叉熵代价函数,利用随机梯度下降法更新模型参数,并通过反向传播算法进行有监督微调,优化模型,得到训练模型参数。最后用测试集测试训练模型,得到分类识别率,评估所设计网络的识别性能。

图7 局部放电缺陷识别流程Fig.7 Partial discharge defect identification process

3 实验结果分析

为了验证论文提出方法的有效性,本节利用图6所示的网络对尖端、空穴、悬浮电位、自由金属颗粒4种类型放电缺陷样本进行训练和测试,对每种放电类型采集500个数据,其中400个作为训练样本,100个作为测试样本。分别处理生成PRPD图像图谱(见图2),并提取统计特征得到统计特征向量,输入网络的图像为100×100的PRPD图谱。

由于用于分类的目标数据集较小,故引入迁移学习的方法来抑制训练目标网络过拟合的情况,使用广州邮科院提供的与本文数据集具有相似性的大量数据集样本作为源数据集,该数据集总共有4万多张图片,数据集部分样本如图8所示。

图8 广州邮科院数据集样本Fig.8 Dataset sample of Guangzhou academy of posts

将从源数据集中学习到的先验知识迁移到目标数据集中,一定程度上避免了过拟合现象,同时提高了模型的泛化能力[23]。操作步骤如下。

1)使用源数据集预训练卷积网络模型,保留预训练后的模型权重参数,将其作为模型训练过程中的特征提取源;

2)加载预训练模型的权重和参数,删除网络最后的输出分类层,添加一个新的输出分类层,与目标数据集中的类别数量一致,本文中为4类;

3)随机初始化新的输出分类层权重,并冻结预训练过的网络中的卷积层和池化层的所有权重;

4)进行迁移后网络重训练,训练该网络以更新连接层的权重,得到迁移学习后的网络模型;

5)使用迁移学习后训练好的网络进行验证识别准确率。

本节研究了不同激活函数对分类识别效果的影响,对比了普通CNN网络的识别效果,并和传统的浅层网络SVM和BPNN进行了比较。实验硬件平台为Windows 10操作系统,Intel i5-8500 CPU,16 GByte内存,软件环境为谷歌TensorFlow深度学习框架,Python语言及Pycharm集成开发环境。

3.1 激活函数对分类识别结果的影响

激活函数可以增加网络模型的非线性,提升网络的表达能力,卷积层选择不同的激活函数,其网络收敛的速度和准确率也会不同。常见的卷积层激活函数有Sigmoid函数:f(x)=1/(1+e-x);Tanh函数:f(x)=(ex-e-x)/(ex+e-x);Relu函数:f(x)=max(0,x),它们的曲线如图9所示。

图9 常见激活函数Fig.9 Common activation functions

基于本文设计的网络,分别采用3种不同的激活函数进行实验,实验结果如图10所示。

图10 不同激活函数的识别准确率Fig.10 Recognition accuracy of different activation functions

3.2 对比普通CNN、SVM和BPNN网络

使用本文所提方法进行实验,得到混淆矩阵以及Precison、Recall以及F1-Score等评价指标如表3所示,将文中所提方法与普通CNN网络以及SVM、BPNN网络2种传统机器学习方法进行性能比较。普通CNN网络的输入仅为4种放电缺陷的PRPD图谱图像,不进行特征融合处理,而SVM和BPNN网络则输入5种统计特征量进行识别,得到的4种识别方法结果如表4所示。

表3 混淆矩阵及评价指标Tab.3 Confusion matrix and evaluation index

表4 对比普通CNN、SVM和BPNN网络识别结果Tab.4 Compare the recognition results of normal CNN, SVM and BPNN networks %

由表4可以看出,多特征融合方法总体识别率达到了88.41%,而经过迁移学习改进的多特征融合网络总体识别率最高,为92.77%。相较于其他3种方法,迁移学习改进的多特征融合网络总体识别率分别提高了6.37%、8.58%和15.46%。对3种网络各类型缺陷识别率相对提高值如图11所示。由表4可知,空穴放电和自由金属颗粒放电的误判率最高,且它们之间相互误判最多。分析4种缺陷PRPD图谱可知,由于尖端和悬浮电位放电相较于其他2种缺陷图谱特征较明显,对于这2种各网络都能较好地识别,空穴和自由金属颗粒放电缺陷相似度较高,特征重叠度大,不易区分,而多特征融合网络对于这2种缺陷的识别率则达到了较高水平,分别为90.48%和89.39%,下面将对多特征融合网络对于相似度较高的绝缘缺陷放电类型识别的有效性进行验证。

图11 识别准确率相对提高值Fig.11 Recognition accuracy increases relatively

3.3 相似度较高缺陷识别有效性验证

为了进一步验证本文方法对相似度较高的空穴和自由金属颗粒放电的识别优越性,进行如下实验,使用本文方法单独训练空穴放电和自由金属颗粒放电2种类型缺陷,并将结果与普通CNN网络以及SVM、BPNN网络进行对比,得到的结果如表5所示。

表5 相似度较高缺陷识别有效性验证结果Tab.5 Validation results of defect recognition with high similarity %

由表5可以看出,迁移学习改进的多特征融合网络对相似度较高的2种缺陷的识别率大大高于其他3种网络。由于空穴和自由金属颗粒放电无论是PRPD图谱特征还是相位分布都比较接近,特征重叠率高,导致识别难度相对较高。本文提出的多特征融合网络结合了PRPD图谱图像特征和统计特征,更深层次地挖掘了PRPD图谱的细节信息,从而对空穴和自由金属颗粒放电这2种相似度较高缺陷的总体识别率达到了86.47%。相对于普通CNN、SVM和BPNN网络,识别率分别提高了12.22%、14.86%和22.33%,效果明显。

4 结 论

针对传统局部放电类型识别特征参数选取敏感性差,对相似度较高的缺陷类型识别率不高的问题,本文构建了一种多特征融合卷积神经网络识别方法。将该网络应用于4种典型缺陷的类型识别,研究了不同激活函数下网络的性能,并与普通CNN网络以及传统方法的识别效果进行了对比,得出了以下结论。

1)不同的激活函数对本文识别网络的收敛速度以及识别率有较大的影响,选择正确的激活函数可以大大提高网络的性能。

2)迁移学习改进的多特征融合网络能够充分提取和利用PRPD图谱的图像特征以及统计特征,最大限度地避免特征信息的丢失,相比普通CNN网络以及传统识别方法SVM和BPNN网络,总体识别率分别提高了6.37%,8.58%和15.46%。

3)迁移学习改进的多特征融合网络对于相似度较高,特征重叠度大的空穴和自由金属颗粒放电缺陷能够深入挖掘更深层的特征信息,单独对这2种缺陷做实验,对比普通CNN、SVM和BPNN网络,多特征融合网络对这2种缺陷的识别率达到了87.55%和85.39%,总体识别率分别提高了12.2%、14.86%和22.33%,提升较多。

猜你喜欢
识别率图谱卷积
基于全卷积神经网络的猪背膘厚快速准确测定
基于图对比注意力网络的知识图谱补全
“植物界大熊猫”完整基因组图谱首次发布
基于图像处理与卷积神经网络的零件识别
图表
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别
人工智能现状和发展
中国知名官方智库图谱