煤自燃预测的支持向量回归方法

2018-04-11 02:42雷昌奎王伟峰
西安科技大学学报 2018年2期
关键词:训练样本向量误差

邓 军,雷昌奎,曹 凯,马 砺,王伟峰

(1.西安科技大学 安全科学与工程学院,陕西 西安 710054;2.西安科技大学 陕西煤火防控重点实验室,陕西 西安 710054;3.徐州安云矿业科技有限公司,江苏 徐州 221008;4.中国矿业大学 通风防灭火研究所,江苏 徐州 221008)

0 引 言

煤自燃是影响煤矿安全生产的主要灾害之一,它不仅会造成资源浪费、设备损坏和环境污染,甚至会引起煤尘与瓦斯爆炸,导致严重的人员伤亡和财产损失。根据现场统计和研究表明,煤矿井下煤自燃多发生在回采工作面的采空区或老空区内,由于自燃地点的隐蔽性和难以接近性,这给矿井煤自燃的防治带来了极大的挑战[1-3]。就煤矿安全而言,及时准确的煤自燃预测预报是矿井煤自燃防控的前提。目前,煤的自燃危险性预测及判定的方法主要有煤自燃倾向性预测法、经验统计预测法、综合评判预测法、自然发火实验预测法、气体分析法等[4-6]。由于煤矿开采条件的复杂多变性,使得上述方法在实际应用中仍然存在一些尚待研究的地方。而气体分析法是目前矿井最常用的方法之一,它主要是根据煤自然氧化过程中气体的出现和浓度的变化来判断和预测煤自燃的状态。

煤自燃是一个复杂的动态氧化过程,是煤氧复合作用的结果[7]。随着煤体氧化升温,在不同的温度状态会释放出不同浓度的气体产物,如O2,CO,CO2,CH4,C2H6,C2H4等[8]。因此,可以通过监测气体指标来判定和预测煤自燃的温度和发展状态。然而,煤自燃温度与气体指标之间的关系非常复杂,在数学上体现为某种非线性关系。如何寻找一种合适的方法或者算法来处理煤自燃温度与气体之间的复杂非线性关系是解决问题的关键,也是研究的难点。很多学者在这方面进行了研究,如灰色系统理论、模糊聚类分析、神经网络方法等[9-11]。但由于煤矿井下煤层地质赋存和开采条件等的复杂性和多变性,灰色系统和模糊聚类等方法难易达到预期的精度;而神经网络方法虽然具有优越的非线性处理能力,但是其训练过程中易出现“过拟合”现象[12]。支持向量机是继神经网络之后逐渐被广泛应用的方法,它在解决小样本、非线性以及高维模式识别等问题中体现出特有的优势,适合于处理煤自燃温度与气体产物之间存在的非线性关系。因此,文中采用支持向量回归方法进行煤自燃温度预测研究,并利用粒子群优化算法优化支持向量回归参数,建立参数优化的支持向量机回归模型,以期实现煤自燃温度准确预测,为矿井煤自燃早期预测预警提供科学可靠的信息。

1 理论与建模

1.1 支持向量回归

支持向量机[13](Support Vector Machine,SVM)是由Vapnik领导的研究小组于1995年首先提出的一种基于统计学习理论的VC维理论和结构风险化原理的机器学习方法,可用于模式分类和非线性回归[14-16]。SVM方法是把样本点“升维”,即将本空间非线性数据映射到线性可分的高维空间中,解决样本空间中的高维度非线性问题[17-19]。

支持向量机方法应用于回归问题,称作支持向量回归(Support Vector Regression,SVR)。在支持向量机回归中,设定由输入矩阵组成的n个样本的训练集X=[x1,x2,…,xn]和一个输出向量Y=[y1,y2,…,yn],输入向量x通过非线性映射φ(x)映射到一个高维的特征空间,然后在这个特征空间中构造优化的线性回归函数

f(x)=w·φ(x)+b

(1)

式中f(x)为回归函数求得的预测值;w为权重向量;b为偏置项。

(2)

将式(2)的约束优化问题通过引入拉格朗日函数将其转化为对偶问题,通过求解对偶问题得到式(1)的解

(3)

由于无论样本大小、维数高低,径向基核函数均适用,且收敛域宽,只有一个待优化参数g,易于实现,因此,文中选用径向基核函数。对于径向基核函数的SVR,惩罚因子C和核参数g是影响SVR性能的主要参数,SVR预测结果的准确性和可靠性依赖于(C,g)的最佳选择[20-21]。因此,文中利用PSO对SVR的惩罚因子C和核参数g进行优化选择,来寻求最优的平衡参数对(C,g)。

1.2 粒子群优化算法

粒子群优化(Particle Swarm Optimization,PSO)是由Kennedy和Eberhart于1995年提出的一种基于群体智能的优化算法。

假设在一个D维的搜索空间中,由n个粒子组成的种群X=(X1,X2,…,XN),其中Xi=(xi1,xi2,…,xin)代表第i个粒子在D维搜索空间中的位置,亦代表问题的一个潜在解。根据适应度函数可计算出每个粒子位置Xi对应的适应度值。第i个粒子的速度为Vi=(Vi1,Vi2,…,ViD),其个体极值为Pi=(Pi1,Pi2,…,PiD),种群的全局极值为Pg=(Pg1,Pg2,…,PgD)。在每一次迭代过程中,粒子通过个体极值和全局极值更新自身的速度和位置,更新公式如下

(4)

式中k为当前迭代次数;ω为惯性权重;c1,c2为非负常数,称为加速度因子;r1,r2为分布于[0,1]之间的随机数。

1.3 PSO-SVR建模

根据SVR原理和PSO算法理论,PSO优化SVR参数建立煤自燃预测模型算法流程如下:

Step 1:训练样本和测试样本的载入及其归一化。

Step 2:粒子群优化算法参数初始化。其中,c1=1.5,c2=1.7,C∈[0.01,100],g∈[0.01,50],迭代次数为200,种群规模为20,采用5折交叉验证。

Step 3:产生初始粒子和速度,以交叉验证均方误差作为适应度函数值。依据适应度值,初始化粒子全局极值与个体极值。

Step 4:依据式(4)更新粒子的速度和位置。计算适应度值,更新个体极值与全局极值。

Step 5:判断是否满足终止条件。若满足,则执行Step 6,否则,返回步骤Step 4.

Step 6:输出最优参数对(C,g)。

Step 7:将最优参数赋给SVR,构建参数优化的SVR预测模型。

2 现场测试

为了获得准确的现场测试数据,以彬长集团大佛寺煤矿40106综放工作面作为现场测试基地。40106工作面走向长度1 970 m,倾向长度200 m,采用倾斜长壁式开采,“U”型负压通风。工作面平均煤厚11.65 m,机采3.8 m,平均放煤高度为7.65 m.煤层是低变质程度烟煤,容易发生自燃。

为了全面掌握采空区气体和温度数据,沿工作面倾向方向均匀布置6个测点,测点间距为40 m.分别在进风和回风巷道2侧敷设束管和测温导线,在距离工作面前方200~300 m处通过抽气泵抽取指标气体和测温装置测温。40106工作面采空区的束管监测系统布置如图1所示。

图1 采空区束管监测系统布置示意图Fig.1 Layout of the bundle tube monitoring system in gob

3 结果与讨论

3.1 数据设置

在工作面回采过程中,由于顶板来压,垮落的顶板造成No.2,No.3和No.5测点受到破坏,最终从进风侧的No.1,采空区中部的No.4和回风侧的No.6测点获得了完整的数据。结合现场测试数据,在建模过程中,以测点距工作面的距离(记为L)、O2,CO,CO2和CH4浓度作为模型输入变量,煤温(记为T)作为模型目标输出。通过长期的现场测试,共获得了220组数据,如图2所示,其中160组用于训练建模,剩余的60组用于模型测试。

图2 现场测试数据可视化Fig.2 Visualization of data acquired from in-situ test

3.2 性能指标

为了进一步研究模型的预测性能,在保持训练样本和测试样本不变的条件下,同时利用标准SVR,BP神经网络(BPNN)和多元线性回归(MLR)对煤自燃温度进行训练建模和测试分析。利用平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方根误差(RMSE)和决定系数(R2)4种指标对上述模型预测性能进行评估。

(5)

(6)

(7)

(8)

3.3 对比分析

根据PSO-SVR算法设计,PSO对SVR的寻优结果为C=7.127 8,g=8.223 7.对于标准SVR模型,其参数采用LIBSVM工具箱默认值。采用单隐层BP神经网络建立煤自燃预测模型,隐含层节点数为11,隐含层和输出层的传递函数分别为“tansig”和“logsig”函数。MLR是一种经典的多变量优化组合实现目标变量预测评估的方法,广泛应用于探索因变量与自变量之间的关系。文中的MLR模型通过regress函数建立与实现。

上述4种模型的训练和测试样本的预测结果如图3所示。从图3可知,无论是训练样本还是测试样本,PSO-SVR模型预测结果均紧紧分布在零误差线y=x周围,说明预测结果与真实结果基本一致;BPNN模型的训练样本具有很好的预测精度,但是测试样本的预测结果显示出较大的误差,相当一部分预测点远离零误差线y=x;然而,SVR和MLR模型预测训练和测试的结果均较分散的分布在零误差线y=x周围,说明其具有更大的预测误差。

图3 4种模型预测结果散点图Fig.3 Scatter plot of the predicted results for the four models

从图4可以看出,PSO-SVR和BPNN模型的训练和测试样样本的预测结果均优于SVR和MLR模型;而对于训练样本,BPNN模型预测结果略优于PSO-SVR模型,但是,其测试样本预测结果却远劣于PSO-SVR模型。例如,其训练阶段的最大绝对百分误差为4.41%,但测试阶段的最大绝对百分误差高达15.76%,说明BPNN拥有极佳的建模效果,但是在建模过程中易出现“过拟合”现象,泛化性较差。

图4 4种模型预测结果绝对百分比误差箱形图Fig.4 Box plot of absolute percentage error of the predicted results for the four models

为了更清楚的对比4种模型的预测性能,表1汇总了预测模型的性能指标。由表1可知,就训练样本而言,BPNN预测效果最好,PSO-SVR稍差于BPNN,但相差较小;而对于测试样本,PSO-SVR拥有更好的预测结果,BPNN却显现出与训练样本更大的误差。同时,作为线性回归的MLR模型预测性能最差,说明煤自燃温度与气体指标之间的非线性关系更加显著,线性模型用于煤自燃预测误差较大。对比3个非线性模型,BPNN模型训练和测试样本预测结果反差最大,而PSO-SVR和SVR模型训练和测试样本的预测结果相近,说明PSO-SVR和SVR模型泛化性和鲁棒性更强。同时,相比于SVR模型,PSO-SVR模型MAE、MAPE和RMSE基本是SVR的1/3,而R2更大,表明PSO-SVR模型预测性能更强,更适合于煤自燃预测,同时也进一步说明利用智能算法优化SVR参数能够极大提高SVR的预测性能。

表1 4种模型预测结果汇总

4 结 论

1)利用PSO优化SVR参数,以现场测试数据为基础建立了煤自燃温度预测的PSO-SVR预测模型,并与标准SVR模型、BPNN模型和MLR模型进行对比分析;

2)BPNN模型训练样本预测结果最好,但对测试样本预测结果较差,出现了“过拟合”现象;线性模型MLR对煤自燃预测结果最差,说明煤自燃温度与气体指标间非线性关系更显著,线性回归不宜于煤自燃温度的预测;

3)PSO-SVR模型预测结果相比于SVR模型,预测精度有了极大提高,证实了智能算法优化SVR参数拥有提高SVR预测性能的能力,同时也说明SVR参数对其预测结果的精度和准确性具有重要影响。

参考文献(References):

[1]徐精彩.煤自燃危险区域判定理论[M].北京:煤炭工业出版社,2001.

XU Jing-cai.Determination theory of coal spontaneous combustion zone[M].Beijing:China Coal Industry Publishing House,2011.

[2]马砺,雷昌奎,王凯,等.高地温环境对煤自燃极限参数的影响研究[J].煤炭工程,2015,47(12):89-92.

MA Li,LEI Chang-kui,WANG Kai,et al.Impact of high ground temperature environment on limit parameters of coal spontaneous combustion[J].Coal Engineering,2015,47(12):89-92.

[3]李林,陈军朝,姜德义,等.煤自燃全过程高温区域及指标气体时空变化实验研究[J].煤炭学报,2016,41(2):444-450.

LI Lin,CHEN Jun-chao,Jiang De-yi,et al.Experimental study on temporal variation of high temperature region and index gas of coal spontaneous combustion[J].Journal of China Coal Society,2016,41(2):444-450.

[4]邓军,徐精彩,陈晓坤.煤自燃机理及预测理论研究进展[J].辽宁工程技术大学学报:自然科学版,2003,22(4):455-459.

DENG Jun,XU Jing-cai,CHEN Xiao-kun.Perspectives on spontaneous combustion mechanism and prediction theory of coal[J].Journal of Liaoning Technical University:Natural Science Edition,2003,22(4):455-459.

[5]褚廷湘,杨胜强,刘国忠,等.模糊综合评价对采空区自然发火的评价及应用[J].中国安全生产科学技术,2008,4(1):124-127.

CHU Ting-xiang,YANG Sheng-qiang,LIU Guo-zhong,et al.Fuzzy comprehensive evaluation on the spontaneous combustion in goaf and its application[J].Journal of Safety Science and Technology,2008,4(1):124-127.

[6]陈欢,杨永亮.煤自燃预测技术研究现状[J].煤矿安全,2013,44(9):194-197.

CHEN Huan,YANG Yong-liang.Research status of predicting coal spontaneous combustion[J].Safety in Coal Mines,2013,44(9):194-197.

[7]DENG Jun,LEI Chang-kui,XIAO Yang,et al.Determination and prediction on “three zones” of coal spontaneous combustion in a gob of fully mechanized caving face[J].Fuel,2018,211:458-470.

[8]DENG Jun,XIAO Yang,LI Qing-wei,et al.Experimental studies of spontaneous combustion and anaerobic cooling of coal[J].Fuel,2015,157:261-269.

[9]Sahu H B,Mahapatra S S,Panigrahi D C.Fuzzy c-means clustering approach for classification of Indian coal seams with respect to their spontaneous combustion susceptibility[J].Fuel Processing Technology,2012,104:115-120.

[10]ZHANG Yong-jian,WU Guo-guang,MENG Xian-liang,et al.Prediction of oxygen concentration and temperature distribution in loose coal based on BP neural network[J].Mining Science and Technology,2009,19(2):216-219.

[11]WANG Long-kang,REN Ting-xiang,NIE Bai-sheng,et al.Development of a spontaneous combustion TARPs system based on BP neural network[J].International Journal of Mining Science and Technology,2015,25(5):803-810.

[12]Hagiwara Katsuyuki,Fukumizu Kenji.Relation between weight size and degree of over-fitting in neural network regression[J].Neural Networks,2008,21(1):48-58.

[13]Cortes Corinna,Vapnik Vladimir.Support-vector networks[J].Machine Learning,1995,20:273-297.

[14]Nejatian Ibrahim,Kanani Mojtaba,Arabloo Milad,et al.Prediction of natural gas flow through chokes using support vector machine algorithm[J].Journal of Natural Gas Science and Engineering,2014,18:155-163.

[15]TAN Peng,ZHANG Cheng,XIA Ji,et al.Estimation of higher heating value of coal based on proximate analysis using support vector regression[J].Fuel Processing Technology,2015,138:298-304.

[16]施龙青,谭希鹏,王娟,等.基于PCA_Fuzzy_PSO_SVC的底板突水危险性评价[J].煤炭学报,2015,40(1):167-171.

SHI Long-qing,TAN Xi-peng,WANG Juan,et al.Risk assessment of water inrush based on PCA_Fuzzy_PSO_SVC[J].Journal of China Coal Society,2015,40(1):167-171.

[17]陈同俊,王新,管永伟.基于SVR和地震属性的构造煤厚度定量预测[J].煤炭学报,2015,40(5):1103-1108.

CHEN Tong-jun,WANG Xin,GUAN Yong-wei.Quantitative prediction of tectonic coal seam thickness using support vector regression and seismic attributes[J].Journal of China Coal Society,2015,40(5):1103-1108.

[18]MENG Qian,MA Xiao-ping,ZHOU Yan.Forecasting of coal seam gas content by using support vector regression based on particle swarm optimization[J].Journal of Natural Gas Science and Engineering,2014,21:71-78.

[19]FENG Qi-hong,ZHANG Ji-yuan,ZHANG Xian-min,et al.Proximate analysis based prediction of gross calorific value of coals:A comparison of support vector machine,alternating conditional expectation and artificial neural network[J].Fuel Processing Technology,2015,129:120-129.

[20]Protic Milan,Shamshirband Shahaboddin,Petkovi Dalibor,et al.Forecasting of consumers heat load in district heating systems using the support vector machine with a discrete wavelet transform algorithm[J].Energy,2015,87:343-351.

[21]Ramli Makbul A M,Twaha Ssennoga,Al-Turki Yusuf A.Investigating the performance of support vector machine and artificial neural networks in predicting solar radiation on a tilted surface:Saudi Arabia case study[J].Energy Conversion and Management,2015,105:442-452.

猜你喜欢
训练样本向量误差
向量的分解
聚焦“向量与三角”创新题
角接触球轴承接触角误差控制
Beidou, le système de navigation par satellite compatible et interopérable
人工智能
压力容器制造误差探究
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
向量垂直在解析几何中的应用
九十亿分之一的“生死”误差