基于YOLOv5 的太阳能电池片EL 图像缺陷检测算法

2024-04-01 06:41张德钰
电视技术 2024年1期
关键词:背景卷积维度

张德钰

(福州大学 先进制造学院,福建 泉州 362251)

0 引言

在我国将光伏产业列为战略性新兴产业后,光伏产业实现了快速发展,如今已经成为我国为数不多参与国际竞争并取得领先优势的产业[1]。光伏组件通常需要暴露在恶劣的自然条件下,长期的工作容易使多晶硅光伏电池受到严重的破损,如隐裂、指状裂纹、黑斑等,这些问题还会引起高温导致大面积的光伏电路损坏严重,甚至引发火灾[2]。光伏EL 图像检测是一种用于太阳能电池质量检测的方法。EL 图像提供了光伏电池内部电学图像,有助于深入了解光伏电池内部电学特性和结构,为识别和评估电池性能问题提供了关键线索[3]。通过分析EL 图像,能够检测出电池中的缺陷、短路及其他不良现象。及时使用EL 图像检测缺陷进行修复措施或者替换光伏组件,对于提高光伏电池的效率、故障率及使用寿命至关重要。

目前,用于目标检测的主流网络有一阶段的SSD[4]、YOLO,以及二阶段的RCNN、Faster R-CNN等。二阶段网络虽然比一阶段网络的检测精度更高,但是由于其速度慢且需要占用大量内存、大量计算资源的特点,在工业检测中不占优势。而SSD 网络利用多尺度特征图检测不同大小的目标,在检测小目标时往往因特征映射小容易造成信息丢失。

基于此,研究提出一种基于改进YOLOv5 的EL图像缺陷检测算法,采用混合域的方式融合双层的通道注意力及双层的空间注意力对相似背景进行抑制,使用特征融合(Feature Fusion Module,FFM)模块将特征融合,使模型在低配置的硬件设备基础上具备强大的实时检测能力[5]。

1 基于YOLOv5 的EL 图像缺陷检测模型

1.1 YOLOv5 概述

YOLOv5 作为一阶段网络,在网络架构相同的情况下具有4 种不同版本,分别为YOLOv5s、YOLOv5m、YOLOv5l 和YOLOv5x。YOLOv5s 具有最小的深度和宽度参数,对硬件的要求也最低。YOLOv5 网络结构可以分为3 个部分:Backbone、Neck、Head。在Backbone 中,Focus 模块运用切片运算对检测图片进行特征映射,通过卷积后进入CSP 模块。几组卷积和CSP 模块经过一个SPP 模块,SPP 模块的主要作用是获得不同尺度的特征而增加网络的感受野。在Neck 部分,主要由特征金字塔网络和路径聚合网络组成[6]。

1.2 数据增强

使用数据增强增加不同缺陷的样本量可以提高整体检测的精度和实验的可靠性,防止过拟合的情况发生。本研究针对PVEL-AD 中的各类缺陷,采用Cutmix 数据增强、翻转法对EL 图像进行处理[7-8]。Cutmix 在像素基础上整合两个图像样本,对于一个图像随机选取一个区域,使用另一图像填充对应区域,从而得到一个新的图片。这种对图片使用drop 命令的做法并不会改变label,也不会改变整个数据集的分布。

1.3 改进的YOLOv5 模型

改进的YOLOv5 模型如图1 所示,在经过输入端的数据增强后将Backbone 中的第1 个和最后1个C3 模块替换为背景抑制模块。背景抑制模块由4 个并行通道组成,分别为2 个空间注意模块和2个通道注意模块。空间注意模块使得模型有效抑制干扰,而通道注意模块利用每个通道的全局空间信息调整各通道内的特征响应,使模型能够在不影响效率的情况下更有效地抑制无关背景干扰,达到良好的精准度。

图1 改进后的YOLOv5 模型结构

1.4 基于混合域的背景抑制模块

1.4.1 模型概述

受检测的EL 图像在通过深度卷积神经网络进行特征提取时,由于冗余背景的干扰,使背景产生与目标类似的特征响应,进而导致目标识别和定位的准确性受到影响。研究通过全局特征与目标特征之间的联系,加强不同目标之间与相似背景的边缘特征,提出抑制冗余模糊背景的背景抑制模型,以增强网络的表征能力,进而提高网络对EL 图像缺陷检测的精度。对于一张给定的输入特征图,背景抑制模块会对其进行并行的特征计算,同时削弱无关背景的干扰,再使用一个特征融合模块整合有效的特征图信息,从而发挥特征增强的功能。

1.4.2 空间注意力模块

在特征图中,不同位置的像素差异可以在空间维度上体现,通过在空间层面比较每个区域位置的权重,能够较好地识别具有意义的图像特征。空间注意模块框架,如图2 所示。给定一张输入特征图,在通过一个卷积层后分成2 个不同通道压缩的特征图S1和S2。

图2 空间注意模块框架图

为求得S1、S2的共同特征,排除冗余背景的干扰,研究使用交叉的操作加强相同特征,减弱不同特征。相同特征加强后的特征图Y1和不同特征减弱后的特征图Y2为

然后用全局平均池化操作整合空间信息,在沿着通道维度进行拼接后引入一个共享的FFM 模块,将来自空间维度的特征与其他通道上的特征进行融合,具体流程如下。使用向量拼接将空间及上下其他维度支路的特征融合后得到特征图Z,对其进行全局平局池化后得到向量1×1×C。对特征图Z进行重新加权得到特征图Z0,类似于SENet 中的通道权重相乘[9]。图3 为FFM 的结构图。

图3 FFM 模块结构图

FFM 模型计算公式为

式中:n为样本特征的数量,Xi为第i个特征值,ω0为参数模型。在忽略常数项及一次项后,模型方程可化简为

式中:j为特征,fi、fj分别为第i个特征和第j个特征所属的域。

1.4.3 加强空间维度背景抑制

由于EL 图像具有相似性,在空间模块中加入一个与无缺陷的EL 特征图进行比对的空间背景抑制模块,可以忽略与无缺陷EL 图像一致的信息,将权重分布在更感兴趣的区域,具体操作如图4所示。

图4 空间维度的背景抑制加强模块

基本流程与之前空间注意模块相同,舍弃分割成两部分的输入特征图中的一部分,用一张无缺陷EL 特征图替代。在背景抑制步骤中,由于使用的是无缺陷的特征图,需要抑制相同的特征,加强不同的特征,并与空间注意模块一致,进行全局平均池化和拼接后,由FFM 模块融合信息。在此操作后,可减少网络计算复杂度,加强排除冗余背景的能力,提高网络精准度。

1.4.4 加强通道维度背景抑制

加强通道维度背景抑制的基本流程与加强空间维度背景抑制模块相同,如图5 所示。将一半的输入特征图替换成无缺陷EL 特征图,经过卷积后进行不同特征加强、相同特征减弱的交叉操作。将背景抑制后的特征图进行全局平均池化、卷积、拼接后输入FFM 模块。

图5 通道维度的背景抑制加强模块

1.4.5 融合方式

整个模块共使用2个不同维度的4个并行通道,并使用并联的方式通过FFM 模块联结在一起。在整个模块中,4 个并行通道具有各自不同的功能,因此使用FFM 特征融合模块时不会影响整体的性能。整体联结方式如图6 所示。

图6 整体联结方式

2 实验过程分析

2.1 数据集

PVEL-AD 是由河北工业大学、北京航空航天大学联合发布的数据集,又称为EL2021 数据集,用于光伏电池异常缺陷检测基准测试。PVEL-AD 共有36 543 张近红外图像,包含各种内部缺陷和异构背景,包括1 类无异常图像和12 个不同类别的异常缺陷图像,如裂纹、指状裂纹、星状裂纹、断栅、黑斑、未对准、粗线、划痕、碎片、断角以及材料缺陷。研究选取3 500 张EL 图像作为训练集,1 000 张PVELAD 作为测试集。其中,黑斑类型1 011 张、星状裂纹类型969张、指状裂纹类型1 999张、裂纹类型123张、粗线类型775 张、水平断错类型266 张,共6 种类型4 500 张EL 图像(部分图像含多种缺陷类型)。

2.2 参数设置

实验均在Windows 10 操作系统下进行,NVIDIA GeForce 3080 显卡为12 GB,Python 版本为3.9,采用PyTorch 2.0 框架。实验设定基本参数为batchsize=16、momentum=0.9、weightdecay=0.001、epoch=300,初始学习率为0.000 1,输入图像大小为1 024×1 024。

2.3 评价指标

本研究采用mAP 作为性能评价指标,计算准确率、召回率、EL 缺陷检测平均准确率、所有EL图片类别的缺陷检测准确率平均值,分别为

式中:P为准确率,TP为预测对的正例,FP为预测错的正例。

式中:R为召回率,FN为预测错的负例。

式中:AP为EL 缺陷检测平均准确率。

式中:Map为所有EL 图片类别的缺陷检测准确率平均值,N为图片类别数量。

2.4 实验结果及分析

除了与原YOLOv5 网络模型对比,为了进一步验证本研究提出的优化算法性能,将改进的YOLOv5s 与Faster R-CNN、EfficientDet、SSD 模型进行比对,并分析其结果。实验结果如表1 所示。

从实验结果可以看出,在参数量减少的情况下,改进的YOLOv5s 网络的mAP50 值高于EfficientDet、Faster R-CNN 以及原始YOLOv5 系列网络,大多数缺陷类别识别精度也高于其他网络。究其原因主要是EL 图像具有大量非均匀的复杂纹理特征,而使用背景抑制模型替换原有网络的第1 个和第4 个C3部分后,能够有效抑制模糊背景的影响,抑制复杂背景对各缺陷特征的干扰,多尺度识别有效特征,提高了模型对缺陷和背景的辨识度,从而很好地提升了算法检测性能。原始YOLOv5 与使用背景抑制模型后的YOLOv5s 检测结果分别如图7 和图8 所示。

图7 YOLOv5 检测结果

图8 改进后的检测结果

3 结语

为提高太阳电池EL 图像缺陷检测的准确度和可靠性,提出一种基于改进YOLOv5 框架的EL 图像缺陷多分类检测方法,运用数据增强和背景抑制模块,使模型可以很好地对EL 图像缺陷进行检测和分类。实验结果表明:相比于原始YOLOv5s模型,改进后的模型参数量从7.02×106下降到6.79×106;针对背景复杂的EL 图像缺陷,识别精准度有小幅提升,mAP50 从77.89 提升到87.74。下一阶段的目标是将模型转移到边缘设备中,并对系统进行测试,使其能够实时检测EL 图像缺陷。

猜你喜欢
背景卷积维度
“新四化”背景下汽车NVH的发展趋势
基于3D-Winograd的快速卷积算法设计及FPGA实现
《论持久战》的写作背景
浅论诗中“史”识的四个维度
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
晚清外语翻译人才培养的背景
光的维度
“五个维度”解有机化学推断题
一种基于卷积神经网络的性别识别方法