基于RF特征选择的BAS-SVM变压器DGA故障诊断技术研究

2024-03-01 07:07谢闻捷王永威陈豪钰杨淑凡
电工材料 2024年1期
关键词:故障诊断准确率变压器

谢闻捷, 王永威, 陈豪钰, 杨淑凡

(三峡大学 电气与新能源学院,湖北宜昌 443002)

0 引言

变压器是供电系统的关键设备之一,保证变压器安全平稳地工作是保证供电正常工作和电源安全可靠的前提。而在变压器的实际运行中,电力系统因各种原因导致的突发故障以及变压器自身的设备老化问题,都会对变压器的运行造成严重的不良影响,当这种影响对设备造成的损害达到一定的程度,就会发生变压器的运行故障[1-2]。

目前对于变压器故障诊断国内外学者已经有了一定的研究,考虑到故障数据获取的便捷性以及故障样本与实际故障之间的关联性,油中溶解气体分析(dissolved gas analysis,DGA)技术被广泛应用于提取变压器的故障主要特征信息,该方法可以准确地识别变压器的故障原因。通过DGA技术,对变压器油样品进行化学气相色谱分析,测定油中溶解气体的组分和含量,主要检测的气体包括:H2、CH4、C2H4、C2H6和C2H2等[3]。

DGA技术主要检测变压器油中溶解的特征气体的成分和含量,并且因为故障的原因、部位、严重程度等关系,特征气体与故障之间存在着复杂的对应关系。根据这一现象,国内外的研究人员可以分析到溶解的气体含量值与变压器事故种类和严重程度有关,从而产生了罗杰斯(Rogers)比值法、IEC三比值法、Duval三角形法等传统方法。传统的DGA方式虽然并不依赖于大量的样本训练,但是如今的变压器工作条件越来越复杂,产生的冗余特征信号会影响变压器的故障诊断,从而大幅降低了诊断的准确性。通过对变压器的故障信息进行特征选择,减少高冗余信息所产生的影响,对提升故障诊断的准确度有着重要意义。

在消除特征的领域,随机森林(random forest,RF)作为一个基于集成技术把不同决策树融合到一起的方法,可以有效地处理具有冗余数据的高维特征输入样本,并能评估数据的各个特征在分类问题上的重要性,实现重要度排序。李萌锋等[4]将RF运用变电站隔离开关的定位与识别中,将RF算法运用到对隔离开关的工作状态分类中;董彦军等[5]在电力负荷预测中使用RF对特征重要度排序的特点,从时间日期和气候因素建立的高维特征数据集筛选出重要特征量;在诊断方面,深度神经网络、贝叶斯网络、极限学习机被广泛用作电力变压器的诊断方法,但这些算法受到自身的限制,如人工神经网络等可能容易发生局部最优解的情况,贝叶斯网络的先验概率模型很容易在分类与判断时产生一定错误,极限学习机具有快速的机器学习能力,但无法保证安全性。支持向量机(support vector machine,SVM)具有可以解决较小数据下的机器学习提问,计算速度快,解决非线性问题的特性,由核函数和惩罚因子来共同确定分类性能。在智能算法方面,天牛须搜索(beetle antennae search,BAS)算法拥有出色的全局搜索性能、计算复杂程度低、收敛速度快的特点,无需大量样本便可完成寻优,寻优效率有明显提升。肖旰等[6]在高压电缆故障诊断中,引入BAS算法对卷积神经网络的超参数进行优化,提高模型精度;李镇等[7]将BAS算法使用到有源电力滤波器(APF)的直流侧电压控制问题中,对自抗控制器(ADRC)的参数进行优化,提升了控制精度与响应速度。

综上所述,本研究采用RF算法的MDG值对变压器油中溶解气体的特征量重要度排序,再通过气体的优选, 从而减少数据冗余,在此基础上,利用BAS算法优化SVM的核函数与惩罚因子,并将优选出来的特征量输入到BAS-SVM故障诊断模型中,从而实现故障诊断。将优选特征量与传统特征量对比,并将BAS-SVM与PSO-SVM、ABC-SVM两种模型对比,验证所提的优选特征和BAS-SVM模型的实用性与可靠性。

1 基于RF算法的特征提取

RF是利用集成学习的概念实现多棵决策树集成组合分类器[15]。RF对输入特征量的平均值基尼不纯度GI进行计算,该指标是通过基尼指标计算节点的不纯度以判断特征量的重要程度,即平均值基尼指标下降(mean decrease in Gini,MDG)指标,根据MDG值即可对优选结果做出判断。

以本文所论述的变压器故障诊断方法为例,对RF模型加以解释。假定获得的故障样本(xj,yj)的数量为D个,j=1,2,3...W,其中xj代表变压器设备的W维输入特征,yj代表故障类型,为训练样本的输出值。在计算特征信息xj的重要度时,以一棵决策树i为起始节点,计算xj在第i棵决策树的GI值。

通过计算RF中每棵决策树对应的GI值并取平均值,得到MDG值,就可以得到特征信息xj的重要性。

式中:N为决策树的数量。

2 BAS优化SVM的故障诊断方法

2.1 SVM分类方法

SVM算法适用于小样本学习,对线性可分样本和线性不可分样本都具有良好的处理能力。

通过引入松弛变量ξi以及惩罚因子C,得到最小化优化模型,目标函数和约束条件为:

式中:M(xj)为特征向量xj的MDG值;b为偏置;ω为权重向量。

引入拉格朗日函数以及乘子αj,得到SVM的对偶问题优化模型:

由K-T条件可得,αj需满足:

当αj≠0时,满足对应样本为支持向量。对上述问题求解后的最优分类函数表示为:

式中:K(xi,xj)表示核函数,采用高斯核函数(radial basis function,RBF)[20]。RBF表达式为:

式中;h为核函数。

2.2 BAS算法原理

BAS算法是一种不需要知道函数的具体类型,只需单一个体就能够做到快速寻优的智能算法,大幅降低了计算量。

BAS算法的建模过程如下:

(1)建立天牛须的随机变量,并做归一化数据处理:

式中:k为空间维度。

(2)经过第t次迭代后左右天牛须的空间坐标表示为:

式中:xlt和xrt分别为左右天牛须第t次迭代时的坐标;d0表示触须的间距;x为质心位置。

(3)设适应度函数为f(),则左右触须的最适应度函数值分别为:

(4)天牛的空间位置表示为:

其中,sign()表示符号函数,δt为第t次迭代时的步长因子。

2.3 BAS-SVM故障诊断模型建立

通过BAS优化算法对SVM中的核函数h与惩罚因子C进行寻优,进而提升SVM故障诊断的准确性。BAS-SVM故障诊断流程如图1所示。

图1 BAS-SVM故障诊断流程

BAS-SVM模型诊断流程如下:

(1)构建天牛须随机朝向向量,定义空间维度k。

(2)设置算法的步长因子δ,其表达式为:

其中,eta取[0,1]之间靠近1的值,本文取eta=0.95。

(3)设置适应度评价函数:

式中:N为训练样本数;tsim(i)为第i个样本输出值;yi为第i个样本的实际值。

(4)重新定义天牛须位置。从[-0.5,0.5]中随机选取一个数字设点为新的天牛须起始点,并将新的起始点输入bestX进行存储;通过表达式(13)计算新的起始点适应度,将新的函数值输入bestY进行储存;通过表达式(9)确定新的左右天牛须坐标。

(5)更新bestX和bestY。通过式(10)的函数中f(xr)和f(xl)计算得到左右天牛须的位置,天牛的实时位置由式(9)确定,即对SVM的惩罚因子C和核函数h更新,同时计算实时记录bestX和bestY。

(6)迭代停止。如果计算得到的适应度函数值与预设的精度条件相一致,则执行步骤(7),否则,返回步骤(4)进一步对天牛须位置更新。

(7)得到最优解。最优解即为支持向量机优化的惩罚因素C和核函数h。

3 基于RF特征选择优化的BAS-SVM变压器DGA故障诊断模型

3.1 待选特征集的建立

以三比值法为基础,对常见的5种DGA诊断气体(H2、CH4、C2H6、C2H4、C2H2)构建特征向量来进行分析是目前智能算法的主流故障诊断方式。目前生产运行中的变压器种类、电压等级各不相同,所处的环境、运行年限等也有较大的差别,所以不同的变压器在产生相似的故障时,产生的气体含量和速率不同。因此,定义7种不同的变压器运行状态:正常(normal,N)、低能放电(low energy discharge,LED)、高能放电(high energy discharge,HED)、局部放电(partial discharge,PD)、中低温过热(thermal fault of low and medium temperature,LMT)、高温过热(thermal fault of high temperature,HT)、放电兼过热(Discharge and overheating,DAO),其中每一类故障类型与气体的对应关系如图2所示。

图2 变压器故障类型与故障气体的关系

由图2可知,分析的7种运行状态中,热故障会使绝缘材料的性能减弱,同时热应力会分解固体材料生成一定量的CO和CO2。仅针对发热点分析,CH4和C2H4气体占据了总烃类气体的绝大部分,温度越高,C2H4的含量就会越高。C2H2气体不是热故障产生气体的主要组成成分,占比很低,即使发生严重过热情况时,C2H2也不会有很高的含量。

故本研究不考虑CO和CO2作为参考气体,两种热故障定义如下:①中低温过热,温度低于500 ℃,CH4占比高于C2H4,C2H4占总烃2%以下,总烃较高;高温过热,温度高于500 ℃,CH4占比低于C2H4,C2H4占总烃5.5%以下,H2占氢烃气体的27%以下,总烃高。

以常见的5种DGA诊断气体(H2、CH4、C2H6、C2H4、C2H2)、总烃THC为基础,共生成22种特征气体建立待选特征集(详见表1)。

表1 输入气体待选特征量

3.2 变压器DGA故障诊断流程

按表1中特征量产生的冗余信息,提出基于RF特征选择优化的BAS-SVM变压器DGA故障诊断方法,其具体步骤:①选取5种典型的油中溶解气体,根据相关比值法,生成22维DGA待选输入量;②预处理生成的待选特征集,并对数据集归一化,分为训练集和测试集;③设置RF参数,输入训练样本,输出22维待选特征量的MDG值并排序;④得到MDG值结合SVM对待选特征量优选;⑤设置BAS的迭代次数、空间维度、初始位置的范围;⑥通过训练集完成模型的训练,建立BAS-SVM变压器DGA故障诊断模型;⑦将测试集输入训练好的诊断模型并输出故障类型。

4 算例结果与分析

4.1 基于RF的DGA故障特征优选

本研究主要引用IEC TC10 database DGA数据库和文献[10-11]中的数据,共计350组数据(每种故障类型均有50组样本)。任选其中240组数据作为模型的训练样本,另选110组数据作为测试样本来检测训练后模型的性能。

由表1确定的22维变压器故障待选特征建立需要的DGA故障特征数据库,通过对得到的数据进行归一化处理,可以避免信息冗余的现象,并通过RF对已处理过的信息集中进行优选,设置RF的决策树数量N。决策树的数量决定对输入特征向量的重要度评分的准确性,设置为N=300,以保证模型的准确性。22维特征量的重要度排序如图3所示。

图3 特征向量重要程度排序

由图3可知,不同特征向量重要程度存在较大差异。为了消除冗余特征,需要对输入的特征向量进行优选。图4所示为特征向量数量对诊断准确率的影响。

由图4可知,不同特征的重要程度数值之间存在较大的差异,当输入特征量的维数较少时,SVM模型将无法获得特征量的关键信息,准确率降低;随着输入特征数量逐渐增多,准确率也随之提高,峰值为82.38%,此时的输入特征量达到10个。当输入特征量上升至16个时,准确率开始降低,但继续增加后又趋于平稳,在20个特征量全部输入后准确率为77.67%,这说明在特征量增加到一定个数带来的冗余信息对模型的分类性能产生了一定的负面影响。

通过图4的结果,选择RF排序后的前10种特征作为诊断模型的最优输入特征。定义样本诊断准确率为:

式中:Nright表示正确诊断的样本总数;Nall表示测试样本总数。通过式(14)来验证优选出的10维特征相较于传统DGA数据、无编码比值法以及三比值法的有效性,具体情况见表2。

表2 采用不同特征选择方法的诊断准确率

由表2可知,4种不同特征选择方法的总样本准确率分别为60.95%、76.05%、57.76%、82.38%。其中优选后的特征量对于HED故障的诊断准确率达到100%,证明RF优选后的特征量对于提高故障诊断的准确率具有显著的效果。

4.2 基于RF的DGA特征优选分析

BAS算法通过对SVM中的惩罚因子与核函数优化,可以提高诊断模型的准确率。通过BASSVM诊断模型对上述10种输入特征量进行诊断,设置模型中的各项参数:初始步长δ=5,空间维度K=10,最大迭代次数E=100,惩罚因子C和核函数h从[0.01,1000]随机选取。其适应度变化曲线如图5所示。BAS-SVM的诊断结果如图6所示。

图5 适应度曲线变化趋势

图6 BAS-SVM故障诊断结果

由图5可得,两条适应度曲线都随迭代次数的增加而收敛,在第20次最佳适应度达到最优。由图6可得,相较于表2的故障诊断准确率82.38%,经过BAS算法参数优化的SVM模型的准确率达到了92.78%,提高了10.4%。

4.3 多智能算法DGA故障结果对比

为验证本研究的BAS-SVM算法的优势,将上述优选的10维特征变量分别用于其他主流的SVM故障诊断方法,采用粒子群极限学习机(PSO-SVM)和蜂群极限学习机(ABC-SVM)进行对比实验,三种算法对应的适应度曲线变化如图7所示。两种对比算法的诊断结果如图8、图9所示。

图7 3种智能算法适应度曲线变化趋势

图8 PSO-SVM故障诊断结果

图9 ABC-SVM故障诊断结果

由图7可知,对比3种方法,BAS-SVM的收敛速度与寻优能力相较于其他两种算法都有明显的优势。3种算法的诊断准确率与运行时间对比如表3所示。由表3可知,对相同的故障集样本,BASSVM的诊断用时更少,准确率得到提升,其中对LED和PD的故障诊断准确率均达到了100%,证明了BAS-SVM的准确性与快速性。

表3 3种改进的SVM智能算法的性能对比

5 结束语

研究了一种基于RF特征选择的BAS-SVM变压器DGA故障诊断方法,主要结论如下。

(1)利用RF特征选择方法从22个特征量中优选出10个,对于文中所提到的7种状态的诊断,新的特征量组合比传统的三比值法、无编码比值法、常用DGA数据准确率分别高出21.43%、6.33%、24.62%,并消除了冗余信息。

(2)建立了BAS-SVM故障诊断模型。BAS优化算法具有时间复杂度低、搜索能力强的特点,对SVM的参数进行优化,将故障诊断准确率由82.38%提升至92.78%。

(3)以新的10维特征量作为输入,与传统的PSO-SVM和ABC-SVM相比,BAS-SVM能够更有效地减少模型训练的时间,同时提高了对本文所提不同故障状态的分类准确率,为变压器故障诊断提供了一种新的方法。

猜你喜欢
故障诊断准确率变压器
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
理想变压器的“三个不变”与“三个变”
高速公路车牌识别标识站准确率验证法
开关电源中高频变压器的设计
一种不停电更换变压器的带电作业法
变压器免维护吸湿器的开发与应用
因果图定性分析法及其在故障诊断中的应用
基于LCD和排列熵的滚动轴承故障诊断