基于AlexNet优化的板材材种识别方法*

2022-06-15 08:46杨楠楠姜苏译杨春梅徐凯宏
林业科学 2022年3期
关键词:端面算子木材

杨楠楠 白 岩 姜苏译 杨春梅 徐凯宏

(1.东北林业大学信息与计算机工程学院 哈尔滨 150040; 2.东北林业大学机电工程学院 哈尔滨 150040)

板材具有强度高、质量轻、易加工等优点,广泛应用于人们日常生活的各领域,是生产建设中不可或缺的工业原材料之一; 但不同木材的质地、强度等性能差异较大,准确识别板材材种才能正确使用木材(孙芳利等, 2017)。传统木材识别大多依靠人工方法借助显微镜肉眼分辨,根据纹理、导管和轴向细胞等特征进行判断,识别准确性受很多因素限制,据统计,因木材表面纹理、色差和缺陷的影响,我国实木原料的损失和浪费率每年约10%(李好, 2012),板材的准确识别和利用是亟待解决的问题。

近年来,随着计算机技术和机器学习方法的发展,机器学习技术大量应用于各种图像的分类识别(刘栋等, 2016; 林泽文, 2018),显微图像处理与机器学习技术相结合的应用也较为广泛(孔祥溢等, 2016)。木材端面细胞图像包含丰富的信息,细胞在微观层面的特征参数可以准确反映木材的宏观特性,将木材细胞图像与机器学习技术相结合进行板材材种分类研究,前景非常广阔。高洁等(2006)采用模板匹配法,基于RGB色彩空间对木材端面细胞进行特征提取和分类,并建立了不同的量化标准; 于海鹏等(2007)结合纹理查找表与SVM方法对木材细胞图像进行分类,获得了80%的识别准确率; 白雪冰等(2005)对细胞图像进行归一化,基于灰度共生矩阵提取纹理特征建立分类器并识别。一般的机器学习方法在测试集中能够获得良好的识别率,但是模型鲁棒性较差,用于实践中效果不佳,由此学者开始探讨将深度学习应用于木材种类识别。Zhao等(2014)提出基于卷积神经网络的木材宏观图像分类模型,对热带树种进行分类训练,准确率达86%;为了更加便捷、高效地识别木材种类,基于木材端面细胞的线性特征,吕鸿蒙等(2017)建立了AlexNet神经网络木材识别模型。

本研究以5种木材端面细胞为研究对象,提取多种差异性图像作为数据集,通过图像处理提取特征信息,分别采用支持向量机(support vector machine, SVM)和AlexNet神经网络进行分类识别。根据木材端面细胞区分的差异性,在AlexNet神经网络架构中加入BN算法进行优化,设计一种更高效的板材识别方法提高木材识别准确率,以实现木材高效利用,为珍稀木材种类判别和保护提供依据。

1 图像预处理

木材端面细胞显微切片或涂片制作过程中需进行染色等操作,观察到的木材端面细胞图像含有噪声等干扰因素,故需对提取的木材端面细胞图像进行预处理。首先将端面细胞图像灰度化,基于自适应中值滤波降噪,然后通过直方图均衡化增强图像对比度,最后采用基于边缘检测的分割方法分割图像。

本研究选取我国具有代表性的5种树木,分别为臭冷杉(Abiesnephrolepis)、长白落叶松(Larixolgensis)、鱼鳞云杉(Piceajezoensisvar.microsperma)、鹅掌楸(Liriodendronchinense)和凹叶厚朴(Magnoliaofficinalissubsp.biloba),表1列出了其主要生长地区和树种信息。

表1 试验树种信息Tab.1 Information of experimental tree species

采用光学显微镜将早材木材横切面细胞通过CCD摄像头成像,并输入到计算机中。光学显微镜采集的样本图像如图1所示。

1.1 自适应中值滤波

中值滤波(median filtering)是一种非线性平滑技术,属空域平滑滤波范畴,其工作原理是选定一个大小固定的滤波窗口,该窗口中心像素大小用该滤波窗口中所有像素点值的中值替代(耿帅等, 2011)。由于细胞图像背景较为单一,相比普通中值滤波,采用自适应中值滤波(adaptive median filtering)能更好筛除噪声点,同时在滤波过程中,可根据预先设定好的条件自动调节滤波窗口大小。以臭冷杉为例,滤波结果如图2所示。

图1 5种木材端面细胞图像Fig. 1 The five kinds of wood cell images on end facesa. 臭冷杉 A. nephrolepis; b. 长白落叶松 L. olgensis; c. 鱼鳞云杉 P. jezoensis var. microsperma; d. 鹅掌楸 L. chinense; e. 凹叶厚朴 M. officinalis subsp. biloba.

图2 臭冷杉端面细胞图像滤波结果Fig. 2 The image filtering results of A. nephrolepis cell on end facesa. 含有噪声的细胞图像The cell image with noise; b. 中值滤波后的细胞图像The cell image with median filtering; c. 自适应中值滤波后的细胞图像The image with adaptive median filtering.

1.2 直方图均衡化

图像由许多不同灰度的像素点构成,像素点灰度分布情况能够反映出图像中的大量信息。图像灰度直方图可直观表述像素点灰度分布情况以及各灰度级所含像素点的数量或比例。算法实现步骤(简丽琼, 2015)如下:

1) 分析原始图像的灰度级hi,i=0,1,…,k,…,L-1,其中L为图像灰度级数目;

2) 求出原始图像直方图中灰度分布概率ph(hi)=mi/m,其中mi为不同灰度级像素数,m为图像总像素数;

4) 计算映射后新的量化等级fj=INT[(fmax-fmin)T(h)+fmin+0.5],其中INT为取整符号,j=0,1,…,k,…,t-1,t为输出图像灰度级数目;

7) 利用映射关系改变原始图像灰度级,获得表现为近似灰平均分布的图像。

以长白落叶松为例,端面细胞图像直方图均衡化处理效果如图3所示。

图3 长白落叶松端面细胞图像直方图均衡化处理效果Fig. 3 The processing effect of histogram equalization of the image of L. olgensis cell on end facesa. 原始端面细胞图像The original image of cell on end faces; b. 端面细胞图像直方图均衡化The image of cell on end faces with histogram equalization.

1.3 边缘检测

边缘检测是图像分割的一种常用方法,其基本思想是确定图像中边缘像素。图像中各区块具有特定灰度值,边界通常有明显的边缘区分,基于区域连接性特征进行边界检测,可通过对图像中边缘像素点的灰度值求导检测边缘并进行分割。求导常用的微分算子(Marretal., 1980; Muntarinaetal., 2021)包括Sobel算子、Laplace算子、Canny算子等。由于微分运算是通过模块和图像卷积实现的,实际应用中各微分算子常用小区域模块表示。以鱼鳞云杉为例,图4分别展示了采用Sobel算子、Laplace算子和Canny算子进行边缘检测的分割结果。比较可见,采用Canny算子进行图像分割后的效果最好,所得细胞图像边缘分割完整且无断裂情况,明显优于Sobel算子和Laplace算子的图像分割效果。因此,本研究采用Canny算子进行图像分割。

2 SVM分类

支持向量机(SVM)是一个二值分类器,在小样本分类条件下,可以取得较好分类结果。SVM模型构建过程中,核函数选择对于SVM性能至关重要,鉴于样本图像的线性关系,本研究选用高斯径向基(radial basis function, RBF)核函数,其可将样本映射到更高维的空间,能够处理特征与类标签之间的非线性关系,具有很强局部性,且非常灵活。基于处理后的端面细胞图像特征,支持向量机算法(Cortesetal., 1995)的实现流程如下:

1) 获取训练集样本 (xi,yi),i=1,2,…,n;

2) 代入支持向量机模型的核函数以及错分惩罚因子C;

3) 形成二次优化问题并求解;

5) 将测试样本输入进行测试。

表2通过混淆矩阵显示将90张臭冷杉、86张长白落叶松、92张鱼鳞云杉、88张鹅掌楸和90张凹叶厚朴端面细胞图像分别输入SVM分类器测试的分类结果,多分类器(one-oversus-rest)模型参数σ=4、C=64。图5更加直观展示了板材材种识别结果。

由表2和图5可知,臭冷杉、鱼鳞云杉和长白落叶松3种针叶林与鹅掌楸、凹叶厚朴2种阔叶林的特征差别明显,二者之间不存在误分现象,3种针叶林的识别准确率为82.97%,2种阔叶林的识别准确率为90.10%。

将5种测试样本标记label后放入同一文件夹进行SVM分类器整体批量测试,结果显示整体识别准确率为84.67%。

图4 鱼鳞云杉基于边缘检测的端面细胞图像分割效果Fig. 4 The segmentation effect diagram of the image of P. jezoensis var. microsperma cell on end faces based on edge detectiona. 原始端面细胞图像The original image of cell on end faces; b. Sobel算子边缘检测后的细胞图像The cell image with Sobel operator edge detection; c. Laplace算子边缘检测后的细胞图像The cell image with Laplace operator edge detection; d. Canny算子边缘检测后的细胞图像The cell image with Canny operator edge detection.

表2 基于支持向量机的板材材种分类结果混淆矩阵Tab.2 The confusion matrix of wood species classification results based on support vector machine

3 基于优化的AlexNet神经网络的板材分类识别

3.1 AlexNet神经网络的实现

卷积神经网络训练过程中,需要大数量训练数据集,因此需对原始端面细胞图像进行数据增强,以扩充训练样本数量级,使卷积神经网络更好地拟合。将5种木材端面细胞图像依次进行镜像翻转和随机裁剪,在原始细胞图像上进行10次裁剪,使样本集数量扩充为原来的10倍,最后得到样本总量为29 680张。

本试验在Caffe深度学习框架上进行网络搭建、训练和测试(Jiaetal., 2014)。Caffe底层采用C++语言编写,且有Python和MATLAB接口,对卷积神经网络的支持效果很好。AlexNet支持GPU加速,且drop神经元能够获得良好的拟合性,对二维数据更敏感,很适用于木材端面细胞图像的线性特征。本研究采用AlexNet神经网络模型(Krizhevskyetal., 2017)在Caffe上进行分类训练,AlexNet神经网络流程如图6所示。

图5 基于支持向量机的板材材种识别结果Fig. 5 The recognition results of wood species based on support vector machine

图6 AlexNet神经网络流程Fig. 6 The AlexNet neural network process

将增强后的29 680张图像按7∶3划分,分别保存在训练集和测试集文件夹中,图像制作成LMDB格式数据集用于神经网络训练和测试。训练使用随机梯度下降(stochastic gradient descent)算法(孙娅楠等, 2018)进行权值参数更新。为便于观察,其柱状图如图7所示。

将所有测试样本确定标签后均放入同一文件夹,形成混合测试集,图像制作成LMDB格式数据集进行网络训练。5次测试结果如表3所示。

3.2 基于BN算法优化的AlexNet神经网络

与激活函数层、卷积层、全连接层、池化层相同,BN (batch normalization)(Ioffeetal., 2015)也属于网络的一层,其基本思想是在网络的每一层输入时,又插入一个归一化层,即先做一个归一化处理(归一化至均值0、方差为1),经激活函数后,再进入网络的下一层,是一个可学习、有参数(γ、β)的网络层。这意味着梯度变得更大,可避免梯度消失产生,且会使网络收敛速度变快,节约训练时间。具体实现如下式所示:

图7 基于AlexNet神经网络的板材材种识别结果Fig. 7 The recognition result of wood species based on AlexNet neural network

表3 AlexNet神经网络整体测试结果Tab.3 The overall test results of the AlexNet neural network

(1)

式中: E[x(k)]表示每一批训练数据x(k)的均值; Var[x(k)]表示x(k)的方差。

该过程可能导致神经网络表达能力下降,为避免这一缺点,在每个神经元添加2个调节参数,对变换后的激活再进行反变换,以加强网络表达能力。对变换后的激活进行的操作如下:

(2)

BN的算法原理如下:

(3)

BN算法可极大提升训练速度,加快收敛过程,训练时间大大缩短, 同时增加分类效果,提升整个网络泛化能力,有效防止过拟合现象。BN算法实质上是一个归一化计算过程,调参简单。基于BN算法的优点,采用BN算法取代AlexNet神经网络中的局部响应归一化操作。

由于本试验实际为臭冷杉、长白落叶松、鱼鳞云杉、鹅掌楸、凹叶厚朴5种树种的分类,最终输出结果共5类,故将Softmax层(曾志强等, 2009)的神经元数量改为5。优化的算法流程如图8所示。

3.3 基于优化的AlexNet神经网络的板材材种识别算法实现

依然选择在Caffe深度学习框架上进行网络搭建、训练和测试,使用随机梯度下降算法进行网络权值参数更新。表4给出了网络部分关键参数取值。

原始1 484张端面细胞图像扩充后得到样本总量29 680张,按7∶3划分后分别保存在训练集和测试集文件夹中,图像制作成LMDB格式数据集后用于神经网络训练和测试,结果如表5所示。

优化的AlexNet神经网络对5种木材均表现出良好分类效果,通过混淆矩阵得到的分类结果柱状图如图9所示。

将所有测试样本确定标签后均放入同一文件夹,形成混合测试集,图像制作LMDB格式数据集进行网络训练。5次测试结果如表6所示。

图8 优化的AlexNet神经网络流程Fig. 8 The optimized AlexNet neural network process

表4 关键参数取值Tab.4 The key parameter values

3.4 识别结果比较

3种算法均按7∶3划分样本集为训练集和测试集,其中神经网络样本集需进行数据增强。首先分别测试每种类别的样本准确率,得到分类结果的混淆矩阵,通过混淆矩阵绘制3种算法对每类木材样本识别准确率的柱状图(图10)。测试样本确定标签后均放入同一文件夹,分别对3种分类算法进行整体批量测试,支持向量机分类器测试集的整体识别准确率为84.67%, AlexNet神经网络测试集的整体识别准确率为88.76%, 基于BN算法优化的AlexNet神经网络测试集的整体识别准确率为91.15%,识别效果更好。

表5 基于优化的AlexNet神经网络的板材材种分类结果混淆矩阵Tab.5 The confusion matrix of wood species classification results based on optimized AlexNet neural network

图9 基于优化的AlexNet神经网络的板材材种识别结果Fig. 9 The recognition result of wood species based on optimized AlexNet neural network

表6 优化的AlexNet神经网络整体测试结果Tab.6 The overall test results of optimized AlexNet neural network

图10 3种算法识别准确率对比Fig. 10 The comparison of three methods recognition accuracy

4 结论

本研究以5种木材(臭冷杉、长白落叶松、鱼鳞云杉、鹅掌楸和凹叶厚朴)端面细胞为研究对象,首先提取多种差异性图像作为数据集,通过图像处理提取特征信息; 然后根据样本低维信息,采用高斯径向基(RBF)核函数设计SVM分类器,可以实现木材良好识别;最后基于端面细胞线性特征,建立AlexNet神经网络模型识别木材,同时在AlexNet网络架构中加入BN算法进行优化,减少梯度损失,增强数据拟合性。支持向量机分类器测试集的整体识别准确率为84.67%,AlexNet神经网络测试集的整体识别准确率为88.76%,基于BN算法优化的AlexNet神经网络测试集的整体识别准确率为91.15%。当样本量充足时,AlexNet神经网络模型对木材端面细胞图像的分类效果明显优于SVM分类器,其中,基于BN算法优化的AlexNet神经网络的分类准确率高于AlexNet神经网络和SVM分类器。基于BN算法优化的AlexNet神经网络对图像线性特征更敏感,保留AlexNet神经网络拟合优化性的同时加快寻优速率,可有效提高识别精度,实现木材高精度分类。

猜你喜欢
端面算子木材
一种连体式硅橡胶按键加工用注塑模具
数字说
盖房子
Domestication or Foreignization:A Cultural Choice
加纳木材工业界呼吁政府减免木材进口税以挽救国内木材工业
一种采暖散热器的散热管安装改进结构
QK空间上的叠加算子
一种面板复合辅助工具
逼近论中的收敛性估计