基于行波特征量与堆叠自动编码器的电缆早期故障定位方法

2019-09-17 01:11
四川电力技术 2019年4期
关键词:行波区段编码器

(深圳供电局有限公司,广东 深圳 518052)

0 引 言

随着城市面积的不断扩张,电缆在高中压配电网所占的比重越来越高。随着电缆运行年限的增加,电缆的绝缘电阻逐渐减小,局部放电逐渐演变成电缆早期故障;早期故障随绝缘电阻的下降会更加频繁地发生,直到绝缘失效,电缆发生永久性故障,引起意外停电事故[1-2]。在发生永久性故障之前,即电缆处于早期故障易发期时,判断电缆的健康状况并进行故障区段定位,将电缆存在隐患的区段进行更换,以防发生意外停电和不必要的经济损失,对电网安全稳定的运行以及电缆寿命的延长有重要意义。

目前国内外对电缆早期故障的检测和定位进行了相关的研究。文献[2]基于小波变换,将电流信号经小波分解后分成不同频段,利用高频信息和低频信息识别和检测早期故障;文献[3]将电流数据进行小波包分解,把结果作为自组织映射神经网络(self organizing map,SOM)的输入向量,对数据进行学习聚类,实现对电缆早期故障严重程度的评估,取得比较好的效果;文献[4]对地下配电线路的现场数据进行时频域分析以确定故障参数,并描述了电缆早期故障的特点,揭示了这种自清除故障逐渐发展过程中的特征;文献[5]利用小波奇异性检测和贝叶斯变点分析来检测早期故障,通过谐波分析和分类器将早期故障区别于电容器投切扰动;文献[6]采用多尺度小波变换提取早期故障电流特征量组成复合判据,再根据参考样本与待测样本之间的灰色关联度识别电缆早期故障;文献[7]提出通过检查故障发生前后负载的一致性,叠加故障分量与接地电流之间持续时间的一致性,来判断早期故障的发生相位和持续时间,为早期故障检测模块的跳闸和报警功能提供设置依据;文献[8]指出应将故障处的电弧电压考虑在内,搭建半周波早期故障单相等值电路,建立算法计算测量端到故障点处的电感,实现故障定位;文献[9]考虑了变电站侧的电感,在瞬时故障发生期间从故障电压和故障电流中分离出净故障电压和电流,通过在故障点注入负电压来表示早期故障的自清除状态,并对线路进行简化,计算线路自感值,以此确定早期故障位置;文献[10]利用单端测量的电压和电流,提出一种考虑电缆电容和负载对距离估计影响的最小二乘拟合方法的改进;文献[11]则将电缆早期故障假设为电弧故障,计算故障电压总畸变率并与参考值比较,判断是否为早期故障,再计算电弧电导判断故障距离。这些基于时域分析的方法,大多对线路都进行一些简化的假设,在使用上有一定局限性。文献[12]给出区分了低压网络电缆不同故障的方法,并结合时域反射法和暂态记录系统对电缆早期故障或者间歇性故障进行定位。

下面提出了基于行波特征量与堆叠自动编码器的电缆早期故障定位方法。通过在PSCAD/EMTDC中搭建电缆早期故障模型,对获得的线路首端电流仿真数据进行处理,引入相模转换得到电流信号的模分量,从中提取行波信息,并且对信号进行S变换获取信号的模时频矩阵,进行早期故障检测;分析获得早期故障位置信息;最后利用提取的特征对堆叠自动编码器进行训练,使其能对早期故障进行准确地识别和区段定位。

1 电缆绝缘老化原因与早期故障的特征分析

1.1 电缆绝缘老化原因和形态

当电缆制造质量好、运行工况良好且不受外力破坏时,电缆的使用寿命很长。但实际运行中,由于电缆本身在材料、制造和敷设过程中难免存在缺陷,加上可能受到的外力挤压或者破坏,受环境中电、热、化学等因素影响,电缆会发生不同程度的绝缘老化。表1给出XLPE电缆绝缘老化原因和形态。

表1 交联聚乙烯电缆绝缘老化原因和老化形态

在局部高电场强度作用下,杂质、水分和气隙等缺陷的存在会在绝缘层中形成树枝状损伤,即为电树枝和水树枝的形成;绝缘中的硫化物和铜导体反应生成硫化铜和氧化铜等,并在绝缘层中呈树枝化生长,即为化学树枝。树枝状的局部损伤会进一步加强局部放电,进而发展成为电缆早期故障,最终绝缘失效演变成为永久性故障。图1给出了老化原因和老化形态间的关系。

图1 XLPE电缆绝缘老化原因和老化形态之间的关系

1.2 电缆早期故障机理与特征

电缆故障是一个逐步发展的过程,以自清除故障为先兆,并最终演变成永久性故障。这种现象在电缆接头中非常常见,水分渗入后会导致绝缘损坏。电弧产生会蒸发水分,产生的高压蒸汽会熄灭电弧,使故障自清除。而电缆早期故障持续时间小于继电保护装置检测和动作时间,所以过电流保护装置不会动作。即使设置较低的整定值,保护装置也会受其他扰动影响。这种情况可能持续几个小时、几天、几个月甚至更久,发生的频率随时间的推移而增加。早期故障最初可能只发生一两次,但在其发展成为永久性故障之前,故障频率会迅速增加[1-3]。

电缆早期故障通常为单相接地故障,是同一相永久故障的前兆。典型的早期故障主要分成两类:半周波故障和多周波故障。半周波早期故障发生在电压峰值附近,持续大约四分之一周波,电弧在电流过零点熄灭,故障自动清除。多周波早期故障也发生在电压峰值附近,持续1~3个周波,故障同样在电弧消失时自清除。图2给出了电缆两种早期故障发生时由线路首端测量得到的相电压、电流波形。从图中可以看出,早期故障发生时,故障相线路首端电压突然下降,而故障相线路首端电流突然瞬时增大。在故障清除后,电压、电流均恢复正常水平。

图2 电缆早期故障波形

2 基于电缆早期故障定位的行波特征量提取

2.1 多相导线波过程及解耦相模转换

在实际系统中,三相线路间存在电磁耦合,如图3所示,各相的波动方程并不相互独立,不能仅仅利用单导线等值电路进行求解。

均匀传输线方程为

(1)

式中:U=[UaUbUc]为三相电压相量;I=[IaIbIc]为三相电流相量;Z为线路阻抗矩阵。

(2)

式中,对角线元素为单位长度线路自阻抗,非对角线元素为单位长度线路互阻抗。

图3 三相线路耦合

为消除线路电磁耦合的影响,通过相模转换将具有耦合关系的相分量转换成不具耦合关系的模分量。相模转换关系为Us=S-1U,Is=Q-1I,代入公式(2)得到

(3)

(4)

式中:Us=[UαUβU0]为电压模分量;Is=[IαIβI0]为电流模分量。

α和β为线模分量;U0和I0为零模分量;当选择凯伦布尔变换时,变换矩阵S-1和Q-1为

(5)

电压模分量和电流模分量为

(6)

(7)

2.2 特征量提取

由于电缆发生早期故障时,故障点产生行波向母线传播,到达母线时会引起电压或电流的突变[13]。利用S变换,可以对信号各个频率分量进行分析,得到对应的幅值变化信息。首先对线路首端检测到的电流信号进行相模转换(凯伦贝尔变换),得到线模分量和零模分量。由于电流突变时刻包含丰富高频分量,集中体现在复时频矩阵的频率较高的行中,选取线模分量和零模分量的电流突变时刻前后一段时间进行S变换。

2.2.1 行波特征量的提取

S变换是由地球学家R.G.Stockwell在1996年提出的一种加窗傅里叶变换分析方法[14]。S变换最早是用于地震信号的分析,它提供了一种频率相关的时频分解方法,同时能保持和傅里叶频谱的直接关系。S变换广泛运用于电力系统中各种信号的处理,可用于对电缆早期故障的特征提取。

先定义连续小波变换:

(8)

式中:W(τ,d)为一个小波或小波母函数;伸缩系数d决定小波的宽度,从而控制分辨率。

S变换可以视为连续小波变换乘上一个相位项,即对连续小波变换进行相位修正。

S(τ,f)=ei2πfτW(τ,d)

(9)

而其用的母小波为

(10)

于是S变换可以写成:

(11)

式中:w(τ-t,f)为高斯窗函数;f为频率;τ为时移因子,用于控制高斯窗在时间轴t上的位置。

信号经过S变换后可以获得复时频矩阵,但矩阵中仍然含有大量的信息,直接将矩阵中的元素输入自动编码器可能造成训练时间过长、拟合效果不佳等情况。因此需要对数据进行预处理,从中提取出用于训练的初始特征,以达到更快的训练速度和更佳的拟合效果。

经过分析可以得出:在不同位置发生早期故障时,检测到的线模分量两次行波的时间差不同,且不受故障点电弧电阻阻值和早期故障初始相角的影响,故可以使用该时间差Δta作为包含早期故障位置信息的特征量。零模分量同样可以进行相同的处理,同样可以得到一组特征量Δt0。由于零模分量的传播路径为线路和大地,波速可能不是一个确定值,导致距离和时间差并不完全对应,故加入线模分量和零模分量第一次到达检测处的时间差Δtα-0。另外,S变换后的模时频矩阵的基频幅值曲线的最大值maxf0同样可以反映电缆早期故障距离,将此作为另一特征量。

2.2.2 S变换能量熵特征量的提取

除了提取行波特征量,还将信号经过S变换后得到的复时频矩阵取模,并计对应的模时频矩阵为G。定义信号能谱Eij=|Gij|2,其中Gij为模时频矩阵G中频率为i、时间为j的元素,选取对数的底为e,则S变换能量熵可以定义为

(12)

S变换能量熵反映了能量在时域和频域上的分布情况,对模时频矩阵不同频段进行划分,划分得越细则分解尺度越大,在一定范围内分解尺度越大,能量熵检测暂态突变的能力越强。将模时频矩阵分解成5个尺度,分别为低频段3个、中频段1个、高频段1个,计算相应的能量熵SEEl1、SEEl2、SEEl3、SEEm、SEEh。

最后可以得到包含S变换能量熵和行波特征量的电缆早期故障区段识别与定位的初始特征量F。

F=[SEEl1,SEEl2,SEEl3,SEEm,SEEh,Δtα,Δt0,Δtα-0,maxf0]

(13)

3 基于行波特征量与堆叠自动编码器的电缆早期故障定位

堆叠自动编码器包含编码和解码部分,编码部分将输入数据通过线性组合和非线性映射得到隐含层数据[15]。如果隐含层数据通过解码能还原输入数据,可认为隐含层的数据能表征输入数据,也就是说隐含层的数据是输入层数据的抽象表达。此时,输出层已经没有太大意义,只取编码部分,即输入层和隐含层。若将这一级编码器的输出作为新的输入数据,继续训练下一级自动编码器,这样就构成堆叠自动编码器,如图4所示。

图4 堆叠自动编码器

由于堆叠自动编码器能够对输入的数据进行深入地挖掘,因此将提取出的初始特征输入到堆叠自动编码器网络中,最后从不同的电流扰动中识别电缆早期故障,并能正确找出电缆早期故障所在区段。算法流程如图5所示。

图5 堆叠自动编码器算法流程

具体步骤如下:

1)在PSCAD/EMTDC中搭建仿真电路,除了电缆早期故障,还考虑其他过电流扰动,如恒定阻抗故障和电容器投切扰动。实际情况中,通常选取变电站电缆馈线测量电流作为分析的原始数据。通过仿真可以获得一系列样本数据。

2)对获得的样本电流数据和电流突变时间段内的电流信号进行S变换,提取用于区段定位的9个特征量,最后组成特征向量F。由于这些特征量来源不同,为了良好的训练效果,将这些数据进行极差归一化处理。

3)对于电缆早期故障,根据其位置可以生成电缆早期故障区段序列,即将早期故障发生区段标记为1,非早期故障区段标记为0;而对于非早期故障,所有区段标记为0。这样,各个样本就有对应的序列作为标签。

4)将整合后的数据输入到堆叠自动编码器中,对堆叠自动编码器的训练分为无监督预训练和有监督微调。对网络进行无监督训练,逐步训练每一层自编码器的参数,提升网络的性能;然后对网络进行微调,通过反向传播算法调整网络参数,提高识别精度。

5)在分类识别中,由于每个区段均为一个二值分类,选择Sigmoid函数进行分类,令输出层的节点数与分区段数相同,这样,网络的输出层结果就作为区段定位的结果。

4 算例分析

4.1 数据来源与模型介绍

用于验证的仿真数据在PSCAD/EMTDC所搭建的系统中获得,搭建10 kV无支路电缆线路模型,如图6所示。采样频率为1 MHz。

电缆模型采用PSCAD/EMTDC依频特性(相位)模型中(frequency dependent(phase)model)。改变两段电缆的长度即是改变早期故障接入的距离,由断路器BRK控制故障电阻是否接入。其中电缆早期故障用电弧模型来模拟,电缆线路至电源之间的元件用等效阻抗表示,线路末端有一组电容器,改变电容器投切的大小并由BRC控制电容器的投切。系统和电缆早期故障的参数分别由表2和表3给出。

表2 电路仿真模型的系统参数

表3 电路仿真模型的电缆参数

由于早期故障大多发生在电压峰值附近,故设置早期故障发生的初始相角在峰值相角的-10°~10°之间,而且早期故障类型分为半周波和多周波故障。对于其他过电流扰动,考虑恒定阻抗故障和电容器投切发生的初始相角为0°~360°;同时改变恒定阻抗值和投切电容器值,恒定阻抗故障的取值范围为0.1~40 Ω,电容器投切值在10~100 μF之间变化。最后得到的仿真样本分布情况如表4所示。

图6 电路仿真模型

表4 仿真样本分布情况

4.2 评价指标

堆叠自动编码器采用隐藏层200×200的结构,按照前面提到的特征提取方法,根据线路首端检测到的电流信号,结合S变换对信号进行处理,提取用于区段定位的特征量F作为网络的输入;另外令故障分区段数和网络的输出层节点数相等,最终堆叠自动编码器的输出即为区段故障信息。这样,区段定位问题就变成多分类问题。

为了评估模型的分类性能,以早期故障发生在区段1为例,表5给出了对应的二分类混淆矩阵。其中TP和TN分别为真正例和真负例,是预测正确的样本数;FN和FP分别为假负例和假正例,是预测错误的样本数。

表5 混淆矩阵

对于电缆早期故障区段选择,属于多分类问题,引入总体准确率ACC、宏平均Macro_F和微平均Micro_F来对结果进行评价。

(14)

(15)

(16)

4.3 与其他方法的比较

传统分类器有K近邻(K-nearest neighbors,KNN)算法,随机森林(random forest,RF)算法,集成学习(ensemble learning,EL)算法等等,选择相同的训练集和测试集,用所提的方法与这几种算法对上述指标进行比较,结果如表6所示。

表6 所提出的方法与其它方法的比较结果

从表6中数据可以看出,所提出的方法分类的准确率最高,达到95.50%,分别比KNN算法、RF算法和EL算法高出11.17%、6.18%和7.67%。另外,从Macro_F和Micro_F可以看出,所提的方法比其他分类算法的值更高,说明具有更加优越的分类性能。

4.4 训练集和分区段数对结果的影响

4.4.1 训练集对结果的影响

采用交叉验证法对训练集的影响进行评估,通过仿真可以获得一系列数据,将这些数据进行分层随机抽样,得到6个互斥子集;选择其中的5个作为训练集,剩余1个作为测试集,得到6组训练/测试集。在不改变网络结构和参数的情况下,计算每一组测试集的准确率。图7给出了当分区段数为10时,每一组训练/测试集分类的准确率。从图中可以看出,不同分组下模型分类都能保持较高的准确率,平均准确率达94.80%,说明模型具有良好的泛化性能,即模型在新数据上仍然有良好的分类能力。

图7 不同训练/测试集的准确率

4.4.2 分区段数对结果的影响

在不改变样本分布的情况下改变电缆分区段数以及堆叠自动编码器的输出层节点数,分别训练网络。图8给出了当堆叠自动编码器以电缆不同区段数进行训练时,迭代次数与测试集准确率的关系。其中,分区段数为5、10和15时,最终的准确率分别为96.33%、95.50%以及94.83%;对于准确率稳定所需的迭代次数,区段数为5时,约在26 000次时稳定,区段数为10时,约在28 000次稳定,而区段数为15则也在28 000次左右稳定。说明对于不同分区段数,同样的网络结构和参数设定效果不同,实际使用中应该考虑这些因素的影响。

另外,由于区段的分割是按照固定距离进行的,当故障发生在两个区段中非常接近的位置时,可能会造成误判,即深度学习网络会将故障区段判断为该故障的相邻区段。考虑到这点,重新对区段数为5、10和15的测试集计算准确率,结果分别为99.50%,99.17%和98.17%。在实际检测早期故障位置时,可以检查相邻区段,就能以较高的准确率排查故障。

图8 不同分区段数的准确率

5 结 论

针对电缆早期故障的区段定位进行研究,通过仿真实验得到以下结论:

1)由于过电流是电缆早期故障的主要特征,故在线路首端设置电流采集模块,利用模变换对相电流分量进行解耦,提取线模电流和零模电流的行波在故障点折反射的时间差等特征量,可以有效反映电缆早期故障发生的距离,并且不受早期故障固定电阻大小和其他参数的影响。

2)将电缆早期故障位置分区段,提取对应的行波等特征量,然后将这些特征量作为堆叠自动编码器的输入,通过堆叠自动编码器自动学习定位早期故障区段的特征。结果表明,与其他传统分类器相比,所提出的方法有更高的准确率,能够准确对早期故障进行区段定位。采用交叉验证法,评估训练集对分类结果的影响,平均准确率达到94.80%,说明所提方法对测试集有较好的泛化性能。

猜你喜欢
行波区段编码器
带有超二次位势无限格点上的基态行波解
一类非局部扩散的SIR模型的行波解
用Riccati方程的新解求Fitzhugh-Nagumo方程的新行波解
融合CNN和Transformer编码器的变声语音鉴别与还原
中老铁路双线区段送电成功
站内特殊区段电码化设计
站内轨道区段最小长度的探讨
基于双增量码道的绝对式编码器设计
浅析分路不良区段解锁的特殊操作
基于数字信号处理的脉冲编码器