大数据时代基于深度学习在图像处理识别中的应用研究

2021-09-10 01:43陈建许青云姚宜昌郭慧林

小作家报·教研博览 2021年16期

关键词：卷积神经网络图像处理深度学习

陈建许青云姚宜昌郭慧林

摘要：随着大数据时代的到来，一系列深度学习网络结构已在图像处理领域展现出巨大的优势，为了能够及时跟踪深度学习在图像领域的最新发展，文章针对深度学习在图像处理领域的相关研究。

关键词：深度学习;卷积神经网络;算法模型;图像处理

中图分类号：G4 文献标识码：A

一、概述

在当今信息飞速发展，数字图像已渗透到社会生活的各角落，因此对图像处理的需求也日益增长。同时身处于大数据时代，数字图像产生的速度快和规模大，所以针对图像信息处理任务也相应地被要求具有高效率，高性能和智能化的特点。

深度学习是机器学习研究领域的重要途径，旨在研究如何从数据中自动地提取多层次特征表示，核心思想是通过数据驱动的方式，采用一系列的非线性变换，从原始数据中提取多层次多角度特征，从而使获得的特征具有更强的泛化能力和表达能力，满足了高效图像处理的需求。

为满足图像处理问题的各类需求，以卷积神经网络为代表的深度学习理论不断取得突破，本文结合深度学习基本原理，对其在图像处理领域的算法，模型甚至方法的演化和创新进行重点论述。

二、深度学习

（一）深度学习的背景

神经网络在二十20世纪50年代被提出，因当时网络训练算法理论欠缺、训练样本不足和电脑的计算能力不足，神经网络发展遇到瓶颈。随着云计算、大数据时代的到来，计算能力的大幅提高可缓解训练的低效性，训练数据过拟合的风险降低，再结合无监督逐层训练策略和BP算法，使得训练很深层的神经网络变得可能，深度学习开始被广泛关注。典型深度学习模型就是深层的神经网络。多隐层堆叠，每一层都对上一层的输出进行处理，从而把最初始的输入与输出目标之间不太密切的联系，转化为更为密切的表示，使得原来仅基于最后一层输出映射难以完成的任务变为可能，这种学习模式即为自动的“特征学习”。

（二）卷积神经网络架构

图像识别是深度学习最早尝试的领域，其中卷积神经网络发挥了巨大的作用。一般卷积神经网络由卷积层，池化层，全连接层这三种类型的层堆叠组成，每个层都有其独有的特点和作用：

1. 卷积层：提取特征，输入特征图 X 与 K 个二位滤波器进行卷积运算输出 K 个二维特征图。采用卷积运算有两点好处：提取相邻像素之间的局部关系;对图像上的平移、旋转和尺度等变换具有一定的鲁棒性。

2. 池化层：处理卷积层输出的结果，对输入的特征图进行压缩，一方面使特征图变小，简化网络计算复杂度;另一方面精简特征图，提取主要特征，降低特征表达维度的同时，也对平移和扭曲等较小形变具有鲁棒性。

3. 全连接层：连接所有特征，将输出值送给分类器。

三、深度学习在图像领域的应用

（一）图像识别

深度学习技术最先是被应用到图像识别方向，并取得了引人瞩目的效果。Alex 等人提出的 Alex Net 网络是第一个用于图像识别的深层卷积神经网络，后续一系列图像识别方面的深度学习发展都是以此为基础，相比于传统的CNN 结构，Alex Net 网络变得更深更宽，该网络由 5 个卷积层和 3 个全连接层依次叠加组成。Alex Net 网络确立了深度学习（深度卷积网络）在图像识别的统治地位，也定义了深度学习模型在图像处理领域的一般性主体架构———前馈卷积神经网络：卷积层与池化层多样化相互堆叠作为特征提取器，随后连接多层全连接层，作为分类器，信息流方向固定而單一。

（二）图像取证

图像的完整周期包含三个部分：图像获取、图像编码、图像编辑。

图像取证的出发点是通过提取图像在上述三周期中留下的固有痕迹（指纹特性）来分析和理解图像的操作历史。

1.深度学习的简单迁移

目前深度学习在图像取证方向研究还很少。Baroffio等人直接将图像识别方向的深度学习模型应用到相机源取证问题中，因为图像在获取过程中由不同相机拍摄都会留下相应相机的指纹特性，所以他们采用类 Alex Net 网络结构的简单深度学习模型来提取相机的指纹特性并加以分类，取得了 94%以上的相机模式分类的准确率。

2. 网络输入

图像取证不同于图像识别的地方在于识别是区分图像内容里的差异，肉眼可以察觉到，而取证则是区分图像中以微弱信号存在的操作指纹，类间形态的差异微乎其微，所以对于图像取证问题一般的深度学习模型不能胜任。因此 Chen 等人对深度学习模型做出了一些改变，在类 Alex Net 网络结构前添加了一个预处理层，放大了取证想要的指纹特征。相比没有预处理层，实验结果准确率提升了 7.22%。图像取证的性质必然决定了网络输入的改变，只有放大了想要提取的指纹特征，深度学习模型才能更好地充当一个特征提取和分类器。

3.适应取证的结构

针对一般取证问题，图像的预处理显然是必不可少的，但额外添加一个预处理层又显累赘，所以Ni等人u提出了一种针对隐写分析取证的深度学习模型，将预处理整合进网络结构中。Ni等人用30个空间富模型滤波器初始化第一层卷积核，使得第一层卷积操作兼顾预处理功能。仅管取证问题不同于识别问题，但学习模型由繁到简是个必然的趋势，相比于图像识别，深度学习在图像取证上的研究才刚刚开始，越来越多适应取证的深度学习模型结构将会被提出，简化图像取证的流程。

（三）图像检测

图像检测相比于图像识别，不仅要识别出图片中的物体，还要定位物体处于图片中什么位置。

1.多模块堆叠

RCNN模型n是利用深度学习进行图像检测的第一个深度学习网络模型，和图像取证一样，在研究的初期，单纯的深度学习模型并不能实现检测的目的。RCNN模型由四个模块组成：Cv用Selective Search算法使每张图像生成1K}2K个候选区域;C2J对每个候选区域，使用深度学习技术提取特征;C3）将特征送入每一类的SVM分类器，判别是否属于该类;C4）使用线性回归器精细修正候选框位置。从中可以看出深度学习模块只起到了特征提取器的作用，这也是一开始各个领域应用深度学习的出发点，虽然是简单的运用，但仍然在目标检测竞赛上取得突破性进展。

2.模块合并

紧接着RCNN模型，Girshick相继提出了fast RCNN模型和faster RC NN模型。后续模型充分运用了深度学习知识，将所有模块逐步整合进深度学习模型中，原本各自单独的模型整合到一体后可以在网络训练时相互约束，共同最小化整个网络的损失函数，推动整个深度学习网络朝更好的方向发展。

四、小结

深度学习在图像领域主要以卷积神经网络研究为主，但卷积运算注定整个网络将会有很大的计算量，导致网络训练花费时间非常长，改变卷积运算形式简化计算复杂度也将会成为一大发展方向。

江西教育厅科技项目：大数据时代基于深度学习的车型识别研究与应用（GJJ191193）

参考文献

[1]丁美昆，徐星琳，蒋财军.深度信念网络研究综述[J].工业控制计算机，2016

[2]常甜甜.支持向量机学习算法若干问题的研究[D].西安：西安电子科技大学，2010.

文章编号：（2021）-16-