基于改进YOLOv5模型的智能立体车库结构裂缝识别算法研究

2024-04-09 15:05赵怡豪刘勇岳仁峰孔令鑫
信息系统工程 2024年3期
关键词:目标识别深度学习

赵怡豪?刘勇?岳仁峰?孔令鑫

摘要:针对立体车库中明暗变化显著、目标尺寸差异大等现象导致的裂缝识别准确度不高的问题,提出了一种基于改进YOLOv5网络的识别算法模型。该模型通过优化特征提取层和增加注意力机制,提高了对不同尺寸目标的识别能力,通过改进的特征融合层结构和检测层输出框尺寸,提升了识别精度。在立体车库结构裂缝数据集上的试验验证表明,该网络收敛速度快,在目标识别率和图像识别准确率方面都有所提升,识别精度高达95.4%,实现了立体车库结构裂缝的精准检测和定位,为高速、高精度的结构裂缝检测提供了理论基础,具有工程应用价值。

关键词:裂缝检测;YOLOv5;深度学习;目标识别

一、前言

裂缝作为结构损伤的表观呈现,既是耐久性不足的预警,也是结构被破坏的先兆。在立体车库中,结构裂缝反映了立体车库地基等支撑结构的受力状态、耐久性及安全性。在现场检测时,裂缝的检测需要人为判断,存在很大的主观因素,加之复杂恶劣的检测环境,导致裂缝检测存在效率低、测不准、检不全等缺点,无法满足立体车库裂缝检测高精度的需求。因此,急需研究高效、高精度的结构裂缝自动化检测技术。

近年来,随着计算机技术的飞速发展,使得开发性能令人满意的网络模型成为可能。根据应用目的的不同,结构裂缝自动检测技术大致可分为两类:一是图像像素级裂缝检测,在分析结构表面纹理状况的基础上,分析裂缝分布等特征,为结构健康状况评估提供精确参数。二是块级路面裂缝检测,类似于给定图像中的目标检测,如Faster R-CNN[1]和YOLO系列[2]等方法,识别速度较快,能够满足实时检测要求,得到广泛的应用。此外,通过深度学习实现结构表面裂缝识别的方法,具有更好的迁移性和鲁棒性,结果更加客观、可靠,在减少了人工成本的同时,大大提高检测效率,具有广阔的应用前景。

在现阶段的研究中,徐国整等[3]提出HU-RseNet卷积神经网络模型识别混凝土表面裂缝。李良福[4]基于改进PSPNet,实现像素级的裂缝区域识别。顾书豪等[5]设计了一种将注意力机制和语义增强相结合的特征模块,有效地融合了语义信息和裂缝特征。可以发现,现有的深度学习检测算法虽然解决了传统算法识别精度低、漏检率高的问题,在识别精度上有所提升,但仍然存在对暗环境下,小目标识别困难的问题。

YOLOv5[6]采用了更轻量的网络结构,在灵活性上远强于YOLOv4,在模型的快速部署上具有极强优势。YOLOv5包括四个版本,分别为YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,在结构上复杂度依次提升,可以根据识别目标的复杂度选择不同版本。检测目标为裂缝,其目标结构简单,背景单一,因此选择在网络结构相对简单的YOLOv5s进行改进。针对立体车库结构裂缝图像中明暗变化明显、目标尺寸差异大等问题,增加了YOLOv5网络注意力机制,改变了特征融合层结构,并利用训练好的模型,进行了对比分析。结果表明此方法具有较高的鲁棒性,对不同环境、不同形状的裂缝均能较好识别,在确保高检测精度的基础上兼顾检测速度。

二、基于改进YOLOv5的多尺度检测算法

立体车库背景复杂,结构性裂缝往往存在光暗变化明显、裂缝尺寸差异大的问题,原YOLOv5模型无法满足该背景下的裂缝检测需求,存在框取不全、重复识别、误检、漏检等情况。针对原YOLOv5模型存在的不足,提出了改进的YOLOv5网络模型,通过引入注意力机制模块,提高网络的细节特征提取能力,减弱光暗变化对目标检测的影响。根据立体车库结构裂缝大小不一的特点,改进了特征融合层结构,增加了多尺度检测层的检测尺度,使模型能够准确地检测不同大小的裂缝目标,增加了算法的健壮性。网络的主体结构包含特征提取层、特征融合层、多尺度检测层,如图1所示。

(一)特征提取层

在兼顾网络检测速度的前提下,针对立体车库环境复杂、采集的图像清晰度低的问题,改进了YOLOv5网络的特征提取層,在Bottleneck CSP模块中引入了注意力机制,提出CBAM_ Bottleneck CSP模块,通过对通道信息的充分利用,增强网络的特征提取能力。CBAM_Bottleneck CSP由CBAM_ Bottleneck和CSP两部分组成,其结构如图2所示。

CBAM_Bottleneck基于残差结构特征提取模块,能够充分利用特征映射的信息冗余特点,提高特征提取能力。CSP是一种基于残差结构的局部、全局特征融合模块,可以增加卷积层特征提取的效率,减少计算量,提高模型的学习能力。

(二)特征融合层

特征融合层作为网络的路径聚合模块,负责将特征提取层输出的特征信息与上采样的信息进行融合。YOLOv5使用FPN(Feature Pyramid Networks)与PAN(Perceptual Adversarial Network)相结合增强网络特征提取能力,自上而下进行特征融合,在实现强语义特征传递的同时,准确保留空间信息,并传递到预测层,实现强定位特征传递,对像素进行适当定位以形成掩模,提高小目标检测能力。

针对立体车库裂缝目标尺寸差异大的问题,通过增加FPN特征金字塔结构,在PAN中增加上采样操作,提高特征信息的融合量,并增加160×160融合层,最终为检测层输出160×160、80×80、40×40和20×20四个尺度的特征图。具体结构如图1中特征融合层所示。

(三)多尺度检测层

采用多尺度检测层对图像特征进行预测,将输出的四个尺度特征图,用于检测不同尺寸的物体,生成预测框并预测类别。网络输出4个预测框信息,包含预测框的位置信息和置信度,由于输出的预测框存在较多的重复冗余,使用非极大值抑制NMS(Non-Maximum Suppression)算法[7],保留置信度最高的预测框位置信息,精确完成目标检测。

三、实验与分析

(一)数据采集及预处理

数据源自某立体车库路面裂缝,共1000张图片,每张图片至少有一处裂缝,背景复杂、明暗变化且噪声较大。实验采用Mosaic数据增强方法对图片进行增强,确保不同的图片都能得到充分的训练,使模型学习到更深层的特征信息,增强模型泛化能力。通过对图像角度、对比度等属性进行不同程度的调整将数据扩充到8000张,增加算法的鲁棒性,提高检测精度。采用labelimg工具对数据进行框选标注,最终整理出6400张标注的图片作为训练集、800张标注的图片作为验证集和800张标注的图片作为测试集。

(二)实验环境及参数设置

实验环境搭建的计算机配置为:Intel(R) Core(TM) i5-7400 CPU @ 3.00GHz、NVIDIA GeForce GTX1050显卡、3 GB内存,并配置使用 CUDA10.1版本和CUDNN7.6版本。深度学习框架平台为Pytorch1.8.0版本。模型训练时的超参数为:初始学习率0.001、动量0.98。模型输入3通道的720×720像素图像,受GPU显存的限制batchsize设为6,优化器采用随机梯度下降法SGD,总共设置迭代1000个epoch。损失函数采用交叉熵损失函数,评价指标为预测精度、召回率、mAP。

(三)实验结果及分析

在对模型进行评估时,首先需选取适当的评价指标。选取召回率Recall、平均精度均值mAP和精确率Precision作为模型算法的评价指标,召回率能够反映检测器漏检目标的问题,平均精度均值能够反映识别网络预测框精准度的情况,精确率能够反映出网络模型检测器误检的情况。改进前后网络各评价指标的对比见表1,改进后的网络预测精度提高了8%,召回率提高了4%,mAP提高了1.87%。

在训练过程中记录观察模型的损失函数曲线如图3所示。原模型损失函数曲线见图3(a),损失函数波动较大,下降缓慢,说明原网络对简单背景下小目标的特征提取能力较弱。改进后模型损失曲线见图3(b),损失函数曲线下降较原模型更快,波动较少,在训练到第500个epoch时损失值达到了0.01,预测边框的平均精度均值mAP更高,收敛速度更快。

测试集中部分图片的识别结果如图4所示,其中方框为预测框,左上角的标签代表这张图片识别的种类和置信度。改进后的模型对于横向裂缝、纵向裂缝、斜向裂缝以及光暗变化明显处的裂缝都比原网络识别得更精准,具有更好的鲁棒性。

四、结论

针对立体车库结构裂缝检测,提出了一种改进的 YOLOv5 网络模型,主要的改进有利用CBAM_Bottleneck模块改进了骨干网络,增强模型特征提取能力,以及针对裂缝大小差异大的问题,改进了特征融合层结构,增加了多尺度检测层的检测尺度,选择20×20、40×40、80×80、160×160尺度检测层,增加了网络对不同尺寸目标框取的精度。实验结果表明,改进后的YOLOv5模型在召回率、平均精度、检测精确度上均得到了不同程度的提升。

参考文献

[1]Shaoqing Ren, Kaiming He, Girshick Ross, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149.

[2]Joseph Redmon, Ali Farhadi. YOLO9000: Better, Faster, Stronger[C]. 30TH IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR 2017), 2017: 6517-6525.

[3]徐國整,廖晨聪,陈锦剑,等.基于HU-Res Net的混凝土表观裂缝信息提取[J].计算机工程,2020,46(11):279-285.

[4]李良福,王楠,武彪,等.基于改进PSPNet的桥梁裂缝图像分割算法[J].激光与光电子学进展,2021,58(22):101-109.

[5]顾书豪,李小霞,王学渊,等.增强语义信息与多通道特征融合的裂缝检测[J].计算机工程与应用,2021,57(10):204-210.

[6]Dihua Wu, Shuaichao Lv, Mei Jiang, et al. Using channel pruning-based YOLO v4 deep learning algorithm for the real-time and accurate detection of apple flowers in natural environments[J]. Computers & Electronics in Agriculture, 2020, 178: 105742.

[7]Han H, Gu J, Zheng Z, et al. Relation Networks for Object Detection[C]. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, IEEE, 2018: 3588-3597.

基金项目:济南市科技计划(后补助)项目社会民生专项(项目编号:202131009)

责任编辑:张津平、尚丹

猜你喜欢
目标识别深度学习
渡口水域安全监管技术研究
全自动模拟目标搜救系统的设计与实现
有体验的学习才是有意义的学习
动态场景中的视觉目标识别方法分析
基于PC的视觉解决方案在 Delta机器人抓放中的应用
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现