优化BP神经网络算法在油茶产量预测中的应用1)

2016-11-19 02:45温雪岩李鹏程陈家男朱泳吴晓峰

东北林业大学学报 2016年10期

关键词：结点权值油茶

温雪岩李鹏程陈家男朱泳吴晓峰

(东北林业大学，哈尔滨，150040) (哈尔滨林业机械研究所)

优化BP神经网络算法在油茶产量预测中的应用1)

温雪岩李鹏程陈家男朱泳吴晓峰

(东北林业大学，哈尔滨，150040) (哈尔滨林业机械研究所)

针对标准的BP神经网络模型对我国南方的重要木本油料树种油茶产量进行预测过程中存在的缺陷，采用相对误差逐步优化回溯算法在迭代过程的参数，使原始的BP神经网算法在运算精度和计算速度上均得到显著的提高，即一种改进的回溯算法优化BP神经网络预测模型。经过试验效验与仿真证明，得到的改进算法不仅能提高油茶产量预测的收敛速度，而且在油茶产量预测精度上也有很大的提高。优化后的BP神经网络算法为多要素因子之间相互影响事件的结果预测，提供了新的设计思路和更好的解决方法。

油茶；BP神经网络算法；回溯法；相对误差

For the defects in predictingCamelliaoleiferayield, we used standard BP neural network model and relative error to optimize the parameters of back-track algorithm in iterative procedure gradually, and improved the calculation precision and calculation speed of original BP neural network algorithm significantly. Through test calibration and simulation proof, the improved algorithm improved not only the convergence rate for predictingC.oleiferayield, but also the prediction precision greatly.

油茶(Camelliaoleifera)是我国南方的重要木本油料树种，也是我国主要食用油料。我国每年油茶产量在1.5亿kg左右，油茶种植面积为3.7×106hm2，占我国木本食用油料面积80%以上，同时具有栽培历史悠久、分布广泛、栽培面积大、价值高和油茶衍生的相关副产品多等特点。我国油茶产量发展大致经历了恢复阶段、有限发展阶段和油茶得到大面积恢复和科技成果推广阶段，油茶种植面积比建国初期增长了几十倍。由此可见，油茶是我国主要的经济树种之一，甚至是南方部分地区的经济发展支柱。

我国居民平均每年的食用油量与世界发达国家相比还是存在较大的差距，近年来我国进口植物油呈上升趋势，对油茶及油茶的副产品需求量急剧增长，但是在我国现有耕地面积紧张的状况下，尤其是适合油茶生长的土地面积相对较小。同时增加食用油产量又是一个十分棘手的问题，所以提高油茶生产机械工作效率和控制影响油茶产量的多要素因子是我国迫在眉睫需要解决的问题[1-2]。

1 标准的BP神经网络算法

BP神经网络是一种多层前反馈神经网络。BP神经网络是向前网络的核心部分，它体现了神经网络中最精华、最完美的内容。BP神经网络由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收外界的输入信息，并传递给隐含层的神经元。隐含层是内部信息处理层，负责信息变换，根据信息变换能力的需求，隐含层可以设计为单隐层或多隐层。最后由隐含层传递给输出层，完成学习的正向传播过程。当实际期望与输出期望不相等时，则按照误差梯度下降的方式修正各层权值，向隐含层和输入层反向传播。

BP神经网络是一种单项传播多层向前网络，其结构如图1所示。由图1可知，BP神经网络是一种3层或者3层以上的神经网络，包括输入层、隐含层和输出层。每层都有许多简单能够执行并且运算的神经元，这些神经元与生物系统中的神经元非常相像，但是就并行性来讲，它并没有生物神经元并行性高。

BP神经网络模型包括其输入输出模型、作用函数模型、误差计算模型等。其中节点输出模型有2种。

隐含层节点输出模型为：

Oj=f(∑(Wij×Xi-qj))。

(1)

输出节点的输出模型为：

Yk=f(∑(Tjk×Oj-qk))。

(2)

式中：f为非线性作用函数，q为神经单元阈值。

作用函数模型是指，反映下层输入对上层节点刺激脉冲强度的函数，又称刺激函数。一般取为(0,1)内连续取值sigmoid函数。其中sigmoid函数为：

(3)

误差计算模型是反映神经网络期望输出与计算输出之间误差大小，其函数为：

(4)

其中:ti为期望输出，Oi为实际输出[3-4]。

图1 BP神经网络结构图

2 传统BP算法在油茶产量预测中存在的缺陷

虽然标准的BP神经网络在各类事物预测方面应用很广泛，但是标准BP神经网络对于具有多要素影响因子碰撞特征的油茶产量预测应用中仍然存在很多缺陷与不足，其中影响产量的多要素因子见表1。多种要素相互碰撞导致标准BP神经网络在油茶产量预测过程中有以下几个方面的不足。

表1 影响油茶产量的要素

注：花期雨日是指降水量≥10 mm的时间。

首先，由于在油茶产量预测过程中学习速率是固定的，因此BP神经网络的收敛速度较慢，需要很长的训练时间。对于类似影响油茶产量的各类要素碰撞较多的复杂问题，BP算法需要训练很长时间，这主要由于学习速率较小造成的，拟采用变学习速率加以改进油茶产量的预测。其次，BP神经网络预测油茶产量的过程中可以使权值收敛到某个值，但不能保证其平面误差的全局最小值，这是因为采用梯度下降的预测方法可能产生局部最小值，这个问题拟采用附加动量的方法解决。再次，预测油茶产量在网络的隐含层要素数目难以确定，隐含层和单元数没有一个较完整的理论来解决，一般来讲都是通过经验和反复试验来确定的。一定程度上增加了网络负担。最后，预测油茶产量在网络中的学习和记忆具有不稳定性。也就是说如果增加了要素碰撞样本，训练好的网络就需要从头开始训练，以前的权值和阈值是没有记忆的。但是可以将预测、分类或聚合较好的权值保存[5]。

3 改进的BP神经网络算法在油茶产量预测中的应用

传统的神经网络算法在对油茶产量预测过程中存在着收敛速度慢、预测精度不高的问题。针对这种特点本文采用改进的回溯算法来优化标准的BP神经网络算法。这种改进方法是通过相对误差进行传递，在传递过程中不断的优化迭代过程中的参数，得到最优参数。

回溯法(又称作试探法)的基本思想：首先确定解空间的组织结构，接着就从开始结点 (根结点)出发，以深度优先的方式搜索整个解空间。这个开始结点就成为一个活结点，同时也成为当前的扩展结点。在当前的扩展结点处，搜索向纵深方向移至一个新结点。这个新结点就成为一个新的活结点，并成为当前扩展结点，如果在当前的扩展结点处不能再向纵深方向移动，则当前扩展结点就成为死结点。换句话说，这个结点不再是一个活结点。此时，应往回移动(回溯)至最近的一个活结点处，并使这个活结点成为当前的扩展结点。回溯法即以这种工作方式递归地在解空间中搜索，直至找到所要求的解或解空间中已没有活结点时为止[6]。

BP神经网络算法收敛速度较低的原因与学习率η和动态量α的选择有关。一般地，为了保证BP神经网络算法的收敛性和减少稳态时的失调，权值更新步长即学习率η不能选的很大，这必然降低学习速率。而动态量α,虽然变动范围较小，但是选择较为准确的动态量α，对BP神经网络算法的学习速率有一定作用。

使用回溯法时，在每一次迭代结束后根据总体误差，训练周期内的平均误差或权误差导数修正α和η的值。根据各个迭代中误差计算的公式，可以推导出下列公式：

η(t+1)=η(t)e(t)e(t-1)。

(5)

(6)

η(t)=η∞+Δη(t)。

(7)

虽然利用回溯算法使BP神经网络收敛速度明显加快，但是在油茶产量预测过程中精度始终没有得到提高，所以针对此缺点采用改进的回溯算法优化BP神经网络。改进后的回溯算法，在每次迭代过程中不断的优化参数，同时使用相对误差作为传递信号，误差反向传播，修改迭代后的网络权值。相对误差在迭代过程中改进回溯算法，这种改进的方法不仅能够继承回溯算法在改进BP神经网络中的优点，还可以使BP神经网络的精度得到提高。所以本文采用的这种优化方法是一种新思路，同时也是对原算法进行改进。一般来说，相对误差更能反映测量的可信程度。相对误差在传递过程中有很多优点，例如相对误差是一个比值，数值大小与单位无关。相对误差能准确的反映出误差的大小和方向，并且它能更确切地反映出测量的准确程度。

这是由于BP算法通常采用绝对误差作为误差传递信号，而当数据间数量关系差距较大时，其绝对误差往往会因不考虑与实际值间关系，而在无形中将系统整体误差值放大，从而导致最终预测结果精确度不高。

将回溯法中的绝对误差转换成相对误差，同时使用相对误差作为传递信号，从后向前传递，依次修改各层网络的权值，达到提高运算精度效果。

隐含层与输出层之间的权值修正量设为Δωjp(n)，由于BP算法中的权值修正量与误差对权值的偏微分成正比，所以有

(8)

(9)

(10)

设局部梯度为：

(11)

(12)

(13)

因此，修正量

(14)

ω(n+1)=ω(n)+Δω(n)。

(15)

同理可得,下次迭代时隐含层上任意节点与另一隐含层上任意节点之间的权值和下次迭代时输入层上任一节点与隐含层上任一节点间的权值[8]。

建立有输入层，隐含层，输出层的神经网络，并通过多要素碰撞因子确定隐含层各层的节点个数。神经网络结构如图2所示。

图2 网络结构图

数据归一化方法是神经网络对数据常用的一种处理方法。数据归一化把所处理的数据全部转化成[0，1]间的数，其目的是取消各维数据间的数量级差别，避免因为输入输出数据数量级差别较大而造成网络预测误差较大。

本次实验验证采用最大最小法，对原始多要素数据进行归一化处理。利用归一化处理的原始数据在实验完成后，还需要对计算结果进行反归一化处理。

本网络创建采用matlab中的newff函数。传递函数采用默认函数为tansig函数；训练函数采用默认函数trainlm函数；权植/阈值学习函数，采用默认函数为learngdm函数；性能函数采用默认函数为mse函数[9]。

本实验采用神经网络为7-14-1，隐含层节点数由隐含层节点数确定公式得到。由于多种要素之间碰撞较多，且输入比较复杂，所以训练次数设置为50 000次。采用matlab对改进的BP神经网络进行训练，训练结果见表2。经过对网络进行仿真后得到实验结果。

表2 改进后算法预测

4 结论

除了上述7个气象要素影响油茶产量预测之外，土地的酸碱程度、机械化投入状况、政府扶持力度等方面的因子，也将对油茶的产量预测有一定的影响，传统的算法模型很难建立受多要素因子碰撞影响事件预测的有效方法。本文是基于受气象因子碰撞影响油茶产量预测的前提，在预测过程中发现各个气象因子之间有着复杂的相互作用，采用改进的回溯算法优化传递过程中的参数是从另一个角度优化BP神经网络在油茶产量中的预测。

根据实验仿真结果，改进前BP神经网络收敛速度为0:01:46，改进前BP神经网络预测油茶产量的平均相对误差为2.503 3%，改进后BP神经网络收敛速度为0:01:08，改进后BP神经网络预测油茶产量的平均相对误差为1.651%，预测精度有了大幅度提高，并且收敛速度十分明显，经过实验验证，基于改进的回溯算法优化BP神经网络在油茶产量中的预测方法是可行并且有效的。所以，改进迭代过程中的参数是一种设计要点。通过改进的回溯算法优化BP神经网络，可以改善受多要素因子影响事件预测的收敛速度和预测的精度，同时也为相似事件的数学建模提供了参考。

[1] 史洁,尹佟明,施季森.我国油茶产业的发展历程及存在问题述评[J].西南林业大学学报,2011,31(6)：86-87.

[2] 庄瑞林.中国油茶[M].北京：中国林业出版社,2008.

[3] 朱大奇,史慧.人工神经网络原理及应用[M].北京：科学出版社,2006.

[4] 张雨浓,曲璐,陈俊维.多输Sigmoid激励函数神经网络权值与结构确定方法[J].计算机应用研究,2012,29(11)：4113-4116.

[5] 苏高利,邓芳萍.论基于MATLAB语言的BP神经网络的改进算法[J].科技通报,2003,19(2)：131-132.

[6] 周建军,詹芹.回溯法与分支限界法的用法取向探讨[J].九江学院学报,2009(3)：18-19.

[7] 黄建国,王建华,芦国强.提高人工神经网络BP算法收敛速度的几种方法[J].华东船舶工业学报,1994,8(2)：26-27.

[8] 马海志,王福林,王慧鹏,等.基于改进BP神经网络的黑龙江农机总动力预测[J].农机化研究，2016(2)：23-24.

[9] 李萍,曾令可,税安泽,等.基于MATLAB的BP神经网络预测系统的设计[J].计算机应用于软件,2008,5(4)：150.

Optimized BP Neural Network Algorithm in PredictingCamelliaoleiferaYield//

Wen Xueyan, Li Pengcheng, Chen Jianan, Zhu Yong

(Northeast Forestry University, Harbin 150040, P. R. China);

Wu Xiaofeng

(Harbin Research Institute of Forestry Machinery)//Journal of Northeast Forestry University，2016,44(10)：56-60.

Camelliaoleifera； BP algorithm； Backward method； Relative error

温雪岩，男，1971年3月生，东北林业大学信息与计算机工程学院，副教授。E-mail: wenxy2005@nefu.edu.cn 。

2015年12月9日。

S-3

1)林业公益性行业科研专项(201204411)。

责任编辑：潘华。