基于粒子群优化最小二乘向量机的地震预测模型①

2012-10-16 02:34徐松金

地震工程学报 2012年3期

关键词：向量粒子神经网络

徐松金，龙文

（1．铜仁学院数学与计算机科学系，贵州铜仁 554300；2．贵州财经学院贵州省经济系统仿真重点实验室，贵州贵阳 550004）

基于粒子群优化最小二乘向量机的地震预测模型①

徐松金1，龙文2

（1．铜仁学院数学与计算机科学系，贵州铜仁 554300；2．贵州财经学院贵州省经济系统仿真重点实验室，贵州贵阳 550004）

为解决地震预测中最小二乘向量机（LSSVM）模型的参数难以确定的问题，利用粒子群算法（PSO）的收敛速度快和全局优化能力，优化LSSVM模型的惩罚因子和核函数参数，建立了PSOLSSVM地震预测模型。通过对地震实例的预测仿真及其相关分析表明该方法的有效性。该方法优于传统的神经网络和支持向量机的地震预测方法，可以有效提高预测效能。

粒子群优化算法；最小二乘向量机模型；地震预测；参数

Abstract：In order to overcome the problem of the uncertain parameters in LSSVM model，the PSO－LSSVM prediction model concerning earthquake forecast is developed，which is based on the particle swarm optimization algorithm with abilities of fast convergence and global optimization．The simulation results show that the proposed method is an effective tool for the prediction of earthquake，and it can effectively enhance the prediction accuracy compared with the way using neural network and support vector machine model．

Key words：Particle swarm optimization（PSO）；Least squares support vector machine（LSSVM）model；Earthquake forecast；Parameter

0 前言

地震孕育过程是一个不稳定的过程。各种地震活动参数和前兆以不同的异常形态表现出其单体或群体异常特征，表明这些地震前兆异常与未来地震的震级之间有着很明显的非线性关系，从而使得地震预测至今仍是世界上的一大科学难题［1－3］。

近年来，作为一种高度自适应非线性动力学系统，神经网络在地震预测中开展了广泛的应用。王炜等［4］利用BP神经网络对我国最大地震时间序列进行预测；陈超等［5］提出一种基于遗传算法优化BP神经网络参数的地震预测模型；陈以等［6］提出了一种基于自组织映射的组合神经网络模型对地震进行预测。虽然人工神经网络模型在地震预测中具有较好的预测结果，但存在网络结构难以确定、易陷入局部极小值等缺点［6］。最小二乘支持向量机（LSSVM）在支持向量机（SVM）的基础上用等式约束替代不等式约束，避免了求解耗时的二次规划问题［7］。LSSVM可以以任意精度逼近非线性系统，是非线性系统建模与预测的有力工具［8－9］。但日前还鲜有文献将LSSVM模型应用到地震预测中。

利用LSSVM模型进行预测时，其推广预测能力很大程度上依赖于惩罚因子C和核函数参数σ，因此确定合适的参数C和σ是使用LSSVM进行建模和预测时所要解决的关键问题。到目前为止还没有指导LSSVM模型参数选择的好方法，也没有什么规律所循，在实际应用中大多凭经验确定参数，这可能导致由于参数选择不恰当而使其预测精度不高。张春晓等［10］采用遗传算法来优化LSSVM参数，虽然遗传算法不依赖于问题的数学模型，但遗传操作比较复杂，后期收敛速度慢。粒子群优化算法（PSO）是近年来发展起来的一种新型的启发式进化算法，具有简单、容易实现、收敛速度快和全局寻优的特点，非常适用于求解非线性模型参数优化问题［11］。本文利用粒子群算法全局优化能力和收敛速度快的优点，优化LSSVM模型的惩罚因子C和核函数参数σ，对参数进行自动搜索和确定，以提高LSSVM模型的预测精度。将PSO－LSSVM模型对地震实例进行预测，检验该方法的有效性。

1 基于PSO优化的LSSVM模型

SVM是在统计学理论上发展起来的一种机器学习算法。与传统的学习方法相比，SVM基于结构风险最小化原则，折衷考虑了经验风险最小化和学习机器VC维的关系，使其具有较强的预测能力。SVM的基本思想是通过非线性映射，把输入空间的数据映射到高维特征空间，将实际问题转化为带不等式约束的二次规划问题。LSSVM是SVM的一种扩展，将不等式约束替代等式约束，把误差平方和损失函数作为训练集的经验损失，从而把问题转化为一个线性矩阵求解问题，大大提高了机器学习训练的速度［7］。

假设给定一组样本数据集｛xi，yi｝mi＝1，其中xi是输入向量，xi∈Rn；yi是对应的输出，yi∈R；m为样本集大小。通过一个非线性函数φ将样本映射到高维空间，然后进行线性回归，回归函数为f（x）＝wTφ（x）＋b（1）其中，w为权值向量；b为偏差。根据结构风险最小化原理，利用LSSVM进行函数回归时要优化的目标函数为

其中C为误差惩罚函数；ξi为松弛变量。构造拉格朗日函数L为

其中ai为拉格朗日乘子。根据KKT条件有

消去w和ξi，可得出

其中Q＝［1，…，1］T；A＝［a1，a2，…，am］T；Y＝［y1，y2，…，ym］T。根据Mercer条件可以确定核函数为

则LSSVM的函数估计为

本文采用径向基函数（RBF）作为核函数

其中σ是核函数宽度。

根据LSSVM回归理论可知，它的主要参数是核函数参数σ和惩罚参数C，这两个参数对LSSVM的学习和泛化能力影响很大。本文采用粒子群算法来优化选择两个参数σ和C，在一定程度上减少了主观经验选择的盲目性，提高其预测精度。

在PSO算法中，ui＝（ui1，ui2，…，uim）表示粒子i的位置向量，pi＝（pi1，pi2，…，pim）表示第i个粒子所经历过的最好位置。每个粒子的速度向量表示为vi＝（vi1，vi2，…，vim），种群中所有粒子经历过的最好位置为pg＝（pg1，pg2，…，pgm）。粒子i的速度、位置更新公式如下：

式中，r1和r2为［0，1］之间的随机数；w为惯性权重。w是粒子群算法的一个关键参数，它可以平衡算法的全局搜索能力和局部搜索能力。在进化初期，我们希望粒子具有较好的探索能力，随着迭代次数的增加，在进化后期，希望粒子具有较好的开发能力。所以在进化过程中需要动态调整惯性权重。因此，本文采用惯性权重w随进化代数线性递减：

其中，iter为当前迭代次数；itermax为最大迭代次数；wmax和wmin为惯性权重的最大值和最小值。

对于LSSVM模型参数的优化，首先定义目标函数

其中，xi是第i个已知样本的输出值；＾xi是第i个样本的LSSVM模型预测值，可由式（1）计算得到。

LSSVM模型参数优化的思想是通过迭代算法搜索一组参数（C，σ），使目标函数式（11）达到最小。本文采用PSO来进行优化，将定义域内一组参数序列（C，σ）作为PSO算法中粒子的位置向量，各粒子的适应度函数取式（11）。基于PSO优化LSSVM模型参数的具体步骤如下：

Step1：根据收集到的历史数据，建立训练样本集合测试样本集。

Step2：设置参数，初始化粒子的位置和速度，每个位置值对应于LSSVM模型的一组参数（C，σ）值，由参数和样本训练建立如式（7）所示的LSSVM预测模型。

Step3：由式（11）计算每个粒子的适应度值。

Step4：判断是否满足迭代终止条件，若满足，则迭代结束输出最优参数（C，σ），转向step6；否则继续执行step5。

Step5：按式（9）和式（10）更新粒子的位置和速度，然后返回step3。

Step6：利用得到的最优参数（C，σ）和训练样本训练建立PSO－LSSVM预测模型。

2 地震预测仿真与分析

选取某地沿海东经117°－120°，北纬22°－26°范围内的地震预测因子数据［12］作为样本，验证PSO－LSSVM模型在地震预测中的有效性。根据地震资料，通过对与地震活动相关的参数进行主成分分析［13］，我们选取地震在时间、空间、强度三方面具有代表性的6个指标，即相关性较强的6个指标，如地震频度、蠕变、能量、b值、缺震和η值作为PSOLSSVM模型的输入向量，实际发生的震级作为输出向量进行训练和测试。

与文献［12］相同，我们一共收集了29组实际数据作为样本数据，其中，前20组数据作为训练样本，后9组数据作为用来检测PSO－LSSVM模型的测试样本，具体数据内容详见表1［12］。

表1 地震样本数据

本文方法的参数设置为：粒子群算法种群规模N＝10，最大迭代次数为itermax＝100，wmax＝0．9，wmin＝0．2，惩罚因子C∈［1，1 000］，核函数参数σ∈［1，10］。通过PSO算法优化LSSVM的两个参数C和σ，最终得到最优参数为：C＝427．36，σ＝3．28。图1给出了利用PSO算法对LSSVM模型参数寻优的迭代曲线。

在训练过程中PSO－LSSVM模型的误差变化如图2所示，可以看出，LSSVM模型训练误差很快就达到了期望的误差目标。为了验证本文方法（PSO－LSSVM）相对于神经网络和支持向量机的优势，利用Elman神经网络和支持向量机（SVM）模型分别对地震震级进行预测。三种方法的预测结果比较见表2，其预测相对误差如表3所示。

图1 PSO对LSSVM参数的寻优曲线Fig．1 Optimization curve for parameters of LSSVM using PSO．

图2 训练过程中误差的变化曲线Fig．2 Error curve in the training process．

表2 三种方法对地震震级的预测结果比较

从表2和表3中的结果可知，PSO－LSSVM模型比Elman神经网络模型和SVM模型得到更好的预测效能。与Elman网络相比，除了第2和第8个测试样本的预测结果略差外，PSO－LSSVM模型在其余7个样本的预测结果明显要优。尤其是第4个和第7个样本，Elman网络得到的结果偏差较大。与SVM模型相比，除了第2、第3和第6个样本的预测结果较差外，PSO－LSSVM模型在其余6个样本的预测结果要明显优于SVM模型。PSOLSSVM模型预测的平均相对误差仅为2．606 5%，比Elman神经网络模型和SVM模型分别要小5．618 6%和2．449 8%，这充分说明PSO－LSSVM模型具有较高的预测效能。

表3 三种方法的预测相对误差比较

3 结论

地震预测的困难之处在于地震预测因子信息的高度非线性［6］。LSSVM能以任意精度逼近非线性系统。结合粒子群算法的全局搜索能力，优化LSSVM模型的参数，建立PSO－LSSVM模型用于地震预测领域中的震级预测。仿真实验结果表明PSO－LSSVM模型具有较高的预测效能。

［1］ Ifantisk A，Giannakopoulos K．Changes of chaotic behavior of the long－term geoelectic potential difference observed during a five－year investigation and its possible relation to seismic activity in Weatern Greece［J］．Chaos，Solitons and Fractals，2002，14（5）：779－795．

［2］ Gotoh M，Hayakawa N A，Smirnova K．Fractal analysis of seismogenic ULF emissions［J］．Physics and Chemistry of the Earth，2004，29（4－9）：419－424．

［3］ King C，Azuma S，Ohno M，et al．In search of earthquake precursors in the water－level data of 16closely clustered wells at Tono［J］．International Journal Geophysical，2000，143（2）：469－477．

［4］王炜，谢瑞，宋先月，等．使用人工神经网络进行我国大陆强震时间序列预测［J］．西北地震学报，2002，24（4）：315－320．

［5］陈超，曾三友，张好春，等．基于遗传神经网络的地震预测研究［J］．计算机应用与软件，2008，25（4）：135－137．

［6］陈以，王颖，张晋魁．组合人工神经网络在地震预测中的应用研究［J］．计算机仿真，2011，28（1）：190－193．

［7］ Suykens J A K，Vandewalle J．Least squares support machine classifier［J］．Neural Processing Letters，1999，9（3）：293－300．

［8］ Van G T，Suykens J A K．Financial time series prediction using least squares support vector machine within the evidence framework［J］．IEEE Transactions on Neural Networks，2001，12（4）：809－821．

［9］ Esen H，Ozgen F，Esen M．Modeling of a new solar air heater through least squares support vector machine［J］．Expert Systems with Applications，2009，36（7）：10673－10682．

［10］张春晓，张涛．基于最小二乘向量机和遗传算法的热式油水两相流含油率建模［J］．化工学报，2009，60（7）：1651－1655．

［11］龙文，梁昔明，董淑华，等．动态调整惯性权重的粒子群优化算法［J］．计算机应用，2009，29（8）：2240－2242．

［12］朱凯，王正林．精通MATLAB神经网络［M］．北京：电子工业出版社，2010．

［13］王炜，林命，马钦忠，等．主成分分析法在地震预测中的应用研究［J］．中国地震，2005，21（3）：409－416．

Earthquake Forecast Model Based on the Partical Swarm Optimization Algorithm Used in LSSVM

XU Song－jin1，LONG Wen2

（1．Department of Mathematics and Computer Science，Tongren University，Guizhou Tongren 554300，China；2．Guizhou Key Laboratory of Economics System Simulation，Guizhou College of Finance and Economics，Guiyang 550004，China）

P315．71

1000－0844（2012）03－0220－04

10．3969／j．issn．1000－0844．2012．03．0220

2011－05－11

国家自然科学基金（61074069）

徐松金（1972－），男（汉族），湖南隆回人，讲师，主要从事复杂系统建模与预测研究．