基于改进单阶段目标检测算法的换流站电气设备目标检测

2024-03-04 01:51辛忠良叶梁劲刘善露付晓勇廖晓辉
电力科学与工程 2024年2期
关键词:换流站电气设备注意力

辛忠良,叶梁劲,刘善露,付晓勇,廖晓辉

基于改进单阶段目标检测算法的换流站电气设备目标检测

辛忠良1,叶梁劲2,刘善露3,付晓勇1,廖晓辉2

(1.国网河南省电力公司 郑州供电公司,河南 郑州 450001;2.郑州大学 电气与信息工程学院,河南 郑州 450001; 3.国网河南省电力公司 濮阳供电公司,河南 濮阳 457000)

针对换流站多种电气设备检测时背景复杂干扰性强而又需要快速准确检测出故障的实际情况,提出基于改进YOLOv5(You Only Look Once)的检测方法。首先,为提高算法的准确性和收敛速度,通过-means聚类算法对YOLOv5模型中的锚框预设进行改进,在数据集预处理阶段得到更适用于换流站电气设备的锚框,使其更加契合换流站电力设备数据集;然后,为提高算法检测过程的识别速度,在特征提取网络添加注意力机制模块,筛选出重要的特征信息。将改进后的算法网络识别效果与YOLOv5中的原始算法网络检测结果进行对比分析。结果表明,检测平均识别精度均值由71.16%提高至92.51%,检测速度由21帧/s提升至31帧/s;同时与R-CNN(Regions with convolutional neural networks)等算法相比,检测精度与速度都有较大提升。添加可解释性分析,将识别结果通过热力图的形式显示,可以更好地应对算法的潜在风险。

特高压输电;换流站;电气设备检测;YOLOv5;聚类算法;注意力机制;可解释性分析

0 引言

换流站作为特高压输电的枢纽,其稳定运行对整个电网的正常运转有着重要意义。对换流站电气设备进行目标检测,及时准确地识别检测换流站电气设备的突发问题,可以提高安检工作效率。对电气设备的检测精度与检测速度是目标检测非常重要的指标。为提高这些指标,基于深度学习的目标检测与自动分析目前受到广泛关注,且应用前景良好。

卷积神经网络(Convolutional neural networks,CNN)是一种深度学习技术,可用于完成图像分类、目标检测、图像分割等任务[1]。近年来,CNN技术发展迅速,目前已经发展到第五代,其中包括AlexNet(Alex networks)、VGGNet(Visual geometry group networks)、GoogLeNet(Google networks)、ResNet(Residual networks)等[2]。这些技术在完成图像分类、目标检测、图像分割等任务方面都取得了很好的效果,并且仍处于不断改进和发展中。

目前,在基于CNN的目标检测算法中最常用的算法包括R-CNN,Faster R-CNN[3]、YOLO[4]、SSD(Single shot multibox detector)等。文献[5]用一种基于Cascade R-CNN的算法来检测输电线路的小目标缺陷。该方法提高了输电线路中小目标缺陷的检测精度。文献[6]在Faster R-CNN算法结构之外用-means聚类算法对数据集的锚点尺寸重新聚类,重新生成适用于车辆的锚点尺寸,发现模型训练收敛速度显著提升。

R-CNN,Faster R-CNN属于2阶段检测算法。虽然算法检测速度也很快、精度也较高,但前者因需要生成候选框而占用了大量内存,后者没有办法达到实时目标检测的效果。

YOLO属于单阶段的目标检测算法。经过多个版本的迭代更新,其检测性能不断提升。这种算法特点是,具有较快的识别速度,占用内存较小,能够满足实时性的要求。文献[7]使用YOLOv5算法在无人机上进行电力巡检快速图像识别。目前,YOLOv5已经成为目标检测方面较为优秀的神经网络模型[8]。

鉴于此,本文采用单阶段的目标检测算法,在YOLOv5模型的基础上进行优化与改进。检测模型总体设计思路是在数据预处理阶段,用-means聚类算法得到更适用于换流站电气设备的锚框,使其更加契合换流站电力设备数据集,使模型的收敛速度与准确性得到提升。在特征提取网络上添加注意力机制模块,筛选出重要的特征信息,从而使电气设备的检测速度与精度达到最大化。

1 数据集制作

针对换流站的实际情况,以换流变压器、站用变压器、平波电抗器、绝缘子串、换流阀等6类电气设备为例,分别采集这6类的图形样本通过各种优化制作成数据集。

数据集中设备图像由现场拍摄图片和网上收集到的图片组成。数据集为VOC格式,输入图片要求jpg格式,图片标签为xml格式。

由于采集方式的差异,所以收集到的图片格式和分辨率并不一致。将得到的2 000张图片按照0001.jpg~2000.jpg的顺序依次重命名。所有图像无需进行分辨率统一调节,在训练前YOLOv5算法会自动将数据集分辨率调整为640×640×3的格式。

使用Labelimg软件对所有图片添加标签,生成标签文件。

将数据集中所有图像按照比例8:2随机划分为训练集和测试集。

2 YOLOv5模型及其改进

2.1 YOLOv5模型简要介绍

以经典卷积神经网络YOLOv5模型为基础,整个算法模型可以分为3个部分,分别是特征提取网络CSPDarknet(Cross stage partial dark networks),加强特征提取网络FPN(Feature pyramid networks)以及特征解释器YOLO Head[9]。

对输入的目标检测图片首先用CSPDarknet主干网络进行特征提取,所提取出的富含语义信息特征集合即特征层。在提取到3个特征层后,再利用FPN整合不同尺度特征信息。YOLO Head是分类器和回归器的组合。利用CSPDarknet和FPN获得3个强化的特征层。每个特征层都有宽度、高度和通道数,可以视为特征点的集合;每一个特征点都有通道数个特征。YOLO Head的任务是判断特征点是否与物体相对应。因此,YOLOv5网络的整体流程是先进行特征提取,然后加强特征,最后预测特征点对应的物体情况。

2.2 K-means聚类算法

聚类算法通常使用距离度量来识别相似的数据点,并将其分到同一个簇中。用此算法可以将数据集中的数据点分组,分析数据集中的模式,发现数据集中的隐藏结构,以便更好地理解数据集的结构。-means是个简单实用的聚类算法,能够快速收敛得到较为理想的聚类效果,能够直观地从聚类结果中分析数据集的特点。-means算法存在容易收敛到局部最优解的问题,因此需要优化初始质心的选择。

-means++是一种-means算法的初始化方法。该方法在选择初始质心时考虑了数据点之间的距离,可以更好地初始化质心,避免质心过于集中或过于分散的情况发生,进而提高算法的准确性和收敛速度。

在目标检测算法中,边界框用于标识物体的位置;预测框是由目标检测模型输出的框;先验框或锚框是根据数据集对象位置聚类得到的,是用于计算预测框的参考。为加速收敛,需用-means++算法对数据集的边界框宽高进行聚类,得到6个先验框。先验框聚类流程见图1。

图1 YOLOv5先验框聚类流程

根据图1,对数据集中2 000张图片的4 863个边界框的宽高数据进行聚类,得到适合该数据集的6个新的先验框模板,使其更符合于实际电气设备图像的标注框,以期能改进算法模型的识别速度与精度。聚类结果如图2所示。

图2 先验框聚类结果

由图2可知,6类检测目标基本各有特点。由于在训练开始之前对所有图像数据的尺寸都统一调整为640×640,因此,其所占图像总像素面积的比例也不能与正常情况相比,但目标的比例是基本不变的。

重新设定锚框尺寸参数:第一个锚框的尺寸为480×480;第二个为250×380;第三个为360×180;第四个为200×600;第五个为150×600;第六个为80×400。这样得到的6类先验框的尺寸更加契合本文中的电气设备数据集。算法在新的先验框基础上生成预测框后,仅需要在这个锚框的基础上进行微调,即可使算法收敛得更快、检测效果更好。

2.3 添加注意力机制

注意力机制是深度学习中至关重要的一个技术,可以帮助网络实现有效的特征选择和分类。在深度学习中,常用的注意力机制实现方式主要有SENet(Squeeze-and-excitation networks)[10],CBAM(Convolutional block attention module)[11],ECA(Efficient channel attention)[12]。

SENet是一种基于通道注意力机制的神经网络架构,其通过引入一个特殊的通道注意模块SE-block来改进传统的卷积网络,提高了模型的准确性[13]。ECA是一种在SENet基础上改进的通道注意力机制[14]。SENet经过全连接层进行降维,破坏了通道与注意力之间的直接对应关系,而且捕获所有通道的依赖关系是没有必要的。ECA模块去除了原来SE模块中的全连接层,直接在全局平均池化之后的特征上通过一个快速一维卷积进行学习。

注意力模块SE与ECA结构如图3所示。图中,左边是常规的SE模块[15],右边是ECA模块[16]。ECA模块用快速一维卷积替换2次全连接。

图3 注意力模块SE与ECA结构

文中,在YOLOv5主干网络提取出的2个有效特征层后面添加ECA注意力模块。对上采样后的结果也进行同样操作。添加注意力机制的YOLOv5网络结构如图4所示。

图4 YOLOv5网络添加注意力机制结构

注意力机制实现过程:

1)经过全局平均池化,输入特征矩阵从[80,80,256]变为[1,1,256]。

2)计算得到自适应一维卷积核大小为5。

3)根据卷积核大小,在一维卷积中,得到特征图的每个通道的权重。

4)将归一化权重和原输入特征图逐通道相乘,生成加权后的特征图。给输入的各个部分对应分配不同的权重。

5)调用ECA注意力模块,生成ECA.py文件,并添加到YOLOv5算法模型的文件夹中,进行训练。

通过上述注意力机制的添加,模型能够从大量的复杂特征信息中较为精准地筛选出重要的特征点信息;同时,算法检测过程的识别速度得到提高,识别准确度得到增强。

3 实验与结果分析

3.1 实验环境

模型训练环境配置为:Windows10系统、R5-5600H处理器、GTX1650显卡、16G内存、Python3.7.3、CUDA11.3。

在进行改进算法实验前,考虑到目标检测算法对训练数据的需求量很大,因此,先对数据集进行混和数据增强。基本策略是:随机获取数据集中的2张图片;然后分别对图片进行翻转、变化色域、缩放等操作;最后将2张图片叠合到一起。

然后,对数据集进行Mosaic数据增强,目的是优化丰富待检测目标的背景,以在有利于小目标检测的同时,丰富数据集的组成、减小GPU的占用。基本策略是:随机获取数据集中的4张图片,分别对其进行随机裁剪、排布、缩放等操作;再将4张图片拼接为1张图片。

模型改进策略:首先对YOLOv5模型中的先验框预设进行改进,利用-means聚类算法得到适用于换流站6类电气设备的6个新的先验框;然后对2个特征层和上采样后的结果都加入注意力机制模块以增加特征提取效果、加速模型收敛、提升识别检测的准确度。

训练结果的损失曲线如图5所示。

图5 损失曲线图

从图5可以看出,前50个时段因采用冻结训练,主干网络参数保持不变,函数下降较慢;后50个时段解冻训练,损失函数曲线立刻下降,在第80个时段时基本趋于稳定。

3.2 评价指标

所采用的模型的评估指标包括精确率(Precision)、平均精度均值(mAP)。

3.3 实验结果分析

对改进后的YOLOv5模型进行测试,并将其与原始网络进行对比分析。共进行3次实验。

实验I:基于YOLOv5原始模型进行识别。

实验II:用-means聚类算法得到新的先验框,再进行识别。

实验III:在实验II的基础上添加注意力机制模块,再进行识别。

测试对象:油枕AP1、换流变压器AP2、普通变压器AP3、绝缘子串AP4、平波电抗器AP5、换流阀AP6。

消融实验结果如表1所示。

由表1可知,目标检测模型网络经过聚类与注意力机制的优化改进后,更加契合换流站电气设备数据集。每一类目标检测效果都有所提升,平均识别精度均值由71.16%提升至92.51%,识别准确率大幅提升;检测速度由每秒21帧提升至每秒31帧。

为了更加直观地显示改进后算法网络的有效性,挑选检测图像进行算法改进前后检测效果对比,结果如图6所示。

表1 消融实验结果

(a)原模型检测效果

(b)改进模型检测效果

图6 检测图像对比图

Fig. 6 Comparison diagram of detecting images

与图6(a)相比,图6(b)中的mAP明显更高。

为了进一步验证本方法的优越性,将本文改进后模型与2种目前性能优异的目标检测算法、原始YOLOv5算法进行对比,结果如表2所示。

表2 不同检测算法性能指标对比

从表2可看出,本文目标检测算法最优。

3.4 可解释性分析

可解释性分析可以帮助用户理解深度神经网络的决策过程。该方法使用权重信息来计算每个特征图的重要性,从而可视化模型的决策过程。此外,通过可解释性分析还可以更好地理解算法的局限性,可以更好地应对算法的潜在风险。

本文通过Grad-CAM绘制识别结果热力图,以反映在对应的检测过程中,网络比较关注图片的哪些区域。具体流程如图7所示。

图7 YOLOv5结果可视化流程

在Yolo.py文件中,创建好模型并且载入预训练权重后,需要指定捕获哪一个特征层A。一般默认都是捕获最后一个卷积层的输出;但是经过测试,发现倒数第二个特征层的效果更好。

在进行检测结果可视化之前,要设置好参数。权重文件是经过训练换流站电力设备数据集后生成的最优权重文件。由于不同数据集可视化效果不尽相同,因此,选取3种可视化的方式,对比后最终采用可视化效果最好的方法。

选择YOLOv5的倒数第二层特征层进行可视化。对于图7中的反向传播求梯度,考虑类别梯度设置适合类别数为“十类以内”较少的数据,而置信度梯度设置适合类别数为“几百类”较多的数据;因此,选择类别梯度。其中,重要参数致信度阈值(conf-threshold)为0.6,置信度排序(ratio)为[0.02,0.1]。

对电力设备识别结果的可视化热力图如图8所示。

图8 识别结果可视化热力图

由图8可以明显看出网络所关注的热力分布。

4 结论

本文对目标检测算法YOLOv5进行优化并获得较好的识别检测效果。主要结论如下:

1)通过聚类算法对先验框尺寸比例重新设定,使其更加契合换流站电力设备数据集。对特征提取网络添加注意力机制模块,筛选出重要的特征信息,提高了算法检测过程的识别速度。

与原始算法网络相比,改进后的算法检测精度与速度都有较大提升。

2)添加可解释性分析,将识别结果通过热力图的形式显示出来,可以更好地理解目标检测算法的决策过程。

[1] IOFFE S, SZEGEDY C. Batch normalization: accelerating deep network training by reducing internal covariate shift[C]//International Conference on Machine Learning. Lille, France: PMLR, 2015: 448-456.

[2] HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Vegas, NV, USA: IEEE, 2016: 770-778.

[3] REN S, HE K, GIRSHICK R, et al. Faster RCNN: towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 39(6): 1137-1149.

[4] REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Vegas, NV, USA: IEEE, 2016: 779-788.

[5] 哈敏捷, 陈梦玲. Faster R-CNN在车辆视频目标检测的应用[J]. 汽车实用技术, 2022, 47(7): 16-18. HA MINJIE, CHEN MENGLING. Application of faster R-CNN in vehicle video target detection[J]. Automobile Technology, 2022, 47(7): 16-18(in Chinese).

[6] 吴军, 白梁军, 董晓虎, 等. 基于Cascade R-CNN算法的输电线路小目标缺陷检测方法[J]. 电网与清洁能源, 2022, 38(4): 19-27. WU JUN, BAI LIANGJUN, DONG XIAOHU, et al. Transmission line small target defect detection method based on cascade R-CNN algorithm[J].Advances of Power System & Hydroelectric Engineering, 2022, 38(4): 19-27(in Chinese).

[7] 苏凯第, 赵巧娥. 基于YOLOv5算法的无人机电力巡检快速图像识别[J]. 电力科学与工程, 2022, 38(4): 43-48. SU KAIDI, ZHAO QIAOE. Fast image recognition of UAV power inspection based on YOLOv5 algorithm[J]. Electric Power Science and Engineering, 2022, 38(4): 43-48(in Chinese).

[8] 王晓玉. 基于复杂场景下抗干扰网络的小目标检测的研究[D]. 天津: 天津大学, 2023. WANG XIAOYU. Research on small target detection based on anti-jamming network in complex scenes[D]. Tianjin: Tianjin University, 2023(in Chinese).

[9] 陈志琳. 基于面部特征的疲劳驾驶检测系统设计与实现[D]. 西安: 西安工业大学, 2023. CHEN ZHILIN. Design and implementation of fatigue driving detection system based on facial features[D]. Xi’an: Xi’an Technological University, 2023(in Chinese).

[10] FU J, LIU J, TIAN H, et al. Dual attention network for scene segmentation[C]//2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Beach, CA, USA: IEEE, 2019: 3146-3154.

[11] HU J, SHEN L, ALBANIE S, et al. Squeeze-and-excitation networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, 42(8): 2011-2023.

[12] ELSKEN T, METZEN J H, HUTTER F. Efficient multi-objective neural architecture search via lamarckian evolution[DB/OL].(2019-02-26) [2023-07-27]. https://arxiv. org/abs/1804.09081.

[13] 程敏. 基于视频的人群多目标跟踪关键技术研究[D].重庆: 重庆理工大学, 2023. CHENG MIN. Research on key technologies of video-based crowd multi-object tracking[D]. Chongqing: Chongqing University of Technology, 2023(in Chinese).

[14] WANG Q, WU B, ZHU P, et al. ECA-Net: efficient channel attention for deep convolutional neural networks[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle, WA, USA: IEEE, 2020: 11534-11542.

[15] 何国立, 齐冬莲, 闫云凤. 一种基于关键点检测和注意力机制的违规着装识别算法及其应用[J]. 中国电机工程学报, 2022, 42(5): 1826-1837. HE GUOLI, QI DONGLIAN, YAN YUNFENG. An illegal dress recognition algorithm based on key-point detection and attention mechanism and its application[J]. Proceedings of the CSEE, 2022, 42(5): 1826-1837(in Chinese).

[16] 王瑞绅, 宋公飞, 王明. 引入ECA注意力机制的U-Net语义分割[J]. 电光与控制, 2023, 30(1): 92-96. WANG RUISHEN, SONG GONGFEI, WANG MING. U-Net semantic segmentation with ECA attention mechanism[J]. Electronics Optics & Control, 2023, 30(1): 92-96(in Chinese).

Target Detection of Electrical Equipment in Converter Station Based on Improved Single-stage Object Detection Algorithm

XIN Zhongliang1, YE Liangjin2, LIUShanlu3, FU Xiaoyong1, LIAO Xiaohui2

(1.State Grid Henan Electric Power Company Zhengzhou Power Supply Company, Zhengzhou 450001, China; 2.School of Electrical and Information Engineering, Zhengzhou University, Zhengzhou 450001, China; 3.State Grid Henan Electric Power Company Puyang Power Supply Company, Puyang 457000, China)

In view of the fact that the background complex interference is strong and the fault needs to be detected quickly and accurately when detecting various electrical equipment in converter station, a detection method based on improved YOLOv5 is proposed. Firstly, in order to improve the accuracy and convergence speed of the algorithm, the anchor frame of YOLOv5 model is improved by-means clustering algorithm, and the more suitable anchor frame for electrical equipment in converter station is obtained in the data set preprocessing stage to make it adapt to electrical equipment data set of converter stations. Then, in order to improve the recognition speed of the algorithm detection process, the attention mechanism module is added to the feature extraction network to filter out the important feature information. The improved algorithm network recognition effect is compared with the original algorithm network detection result in YOLOv5. The results show that the average detection accuracy is increased from 71.16% to 92.51%, and the detection speed is increased from 21 frames/s to 31 frames/s; at the same time, compared with regions with convolutional neural networks, the detection accuracy and speed are greatly improved. By adding interpretability analysis and displaying the identified results in the form of thermodynamic diagram, the potential risks of the algorithm can be better dealt with.

UHV transmission; converter station; electrical equipment detection; improved YOLOv5; clustering algorithm; attention mechanism; interpretability analysis

10.3969/j.ISSN.1672-0792.2024.02.005

TP391.4;TM755

A

1672-0792(2024)02-0042-08

河南省自然科学基金资助项目(232300421198);国网郑州供电公司科技项目(B7171023K080)。

2023-10-27

辛忠良(1970—),男,高级工程师,研究方向为电力系统运维;

叶梁劲(1997—),男,硕士生,研究方向为电力系统检测与控制;

刘善露(1997—),男,工程师,研究方向为电力系统检测与控制;

付晓勇(1986—),男,高级工程师,研究方向为电力系统运维;

廖晓辉(1972—),女,副教授,研究方向为电力系统检测与控制。

叶梁劲

猜你喜欢
换流站电气设备注意力
让注意力“飞”回来
直流输电换流站阀冷却水系统故障实例统计分析
“扬眼”APP:让注意力“变现”
PLC技术在电气设备自动化控制中的应用
A Beautiful Way Of Looking At Things
换流站电阻冷却面板鼓包分析
换流站阀厅避雷器停电例行试验研究
同塔双回牛从直流从西换流站直流控制保护系统分析
10kV变配电站一、二次电气设备的选择
电气设备的防雷接地与保护