基于DBO-LSSVM的空气质量指数预测

2024-03-23 05:25朱宗玖赵艺伟
关键词:蜣螂空气质量种群

朱宗玖,赵艺伟

(安徽理工大学 电气与信息工程学院,安徽 淮南 232001)

空气污染不仅会对身体健康产生威胁,严重者将会影响国家的长远发展,不能以牺牲环境来换取一时的利益[1]。空气质量主要受CO、SO2、NO2、O3、PM2.5和PM10这六种因素影响,将其与空气质量指数(air quality index, AQI)结合可以直观地反映空气质量[2]。在预测模型中,支持向量机(SVM)和最小二乘支持向量机(LSSVM)的使用较为广泛,但其均不能准确选择参数。因此,何柳等[3]通过改进的灰狼算法(DEGWO)对SVM模型的惩罚参数和核函数进行寻优,建立最优DEGWO-SVM诊断模型对电力变压器进行故障诊断;韩旺龙等[4]通过鱼群优化算法进行参数γ和σ的寻优,采用径向基函数作为核函数,建立土壤水分流失预测模型;彭军龙等[5]采用麻雀搜索算法(SSA)对LSSVM模型的正则化参数c和核函数参数σ进行优化,以弥补LSSVM模型参数确定困难的缺陷;王红雨[6]通过海鸥算法(SOA)对LSSVM模型进行优化,得到压降预测模型;栾洲等[7]通过灰狼优化(GWO)算法进行惩罚因子c和核函数参数σ的寻优,再通过随机森林(RF)计算每个特征的重要性和GWO-LSSVM共同建立预测模型,对地表下沉系数进行预测。相比于SVM模型来说,LSSVM模型在一定程度上降低了求解难度,更能适合于求解大规模问题,可以获得较快的速度和较高的精度,因此,选择选取最小二乘支持向量机进行预测。上述文献中,虽然各模型都能实现预测,但精度不高,容易扩大寻优范围使迭代次数增加,不利于寻找最优解。综上,提出一种基于多个子种群,可以利用不同时间段的信息对搜索空间进行彻底的探索,追求更强的搜索能力,以避免陷入局部最优的蜣螂优化算法(DBO)。本研究将LSSVM模型与蜣螂算法相结合,形成DBO-LSSVM预测模型,旨在探索开发一种新型高效率、高精度的预测模型。将该模型应用于空气质量指数预测具有一定的重要意义与应用价值。

1 LSSVM

最小二乘支持向量机(least squares support vector machine, LSSVM),LSSVM是SVM(支持向量机)的一种改进算法,它是将传统的支持向量机中的不等式约束改为等式约束,且将误差平方和损失函数作为训练集的经验损失,把解二次规划问题转化为求解线性方程组问题,提高求解问题的速度和收敛精度,是机器学习中应用较广泛的一种建模方法[8-10]。

LSSVM模型常采用的核函数有高斯径向基核函数(radial basis function, RBF)、线性核函数和多项式核函数。

2 蜣螂算法

蜣螂优化(Dung Beetle Optimizer, DBO)算法是2022年11月,由提出麻雀搜索算法(SSA)的东华大学沈波教授团队提出的一种全新群智能优化算法。对蜣螂的滚球、觅食、偷窃和繁殖行为进行数学建模,提出了DBO算法也可称为蜣螂优化器。该算法将种群中的蜣螂进行了分配,完成这四个不同的行为。DBO算法主要包括四个过程:滚球、繁殖、觅食和偷窃[11]。

2.1 滚球

蜣螂滚球行为分为有障碍物模式和无障碍物模式。

当处于无障碍模式中时,蜣螂利用太阳导航,此时光源的强度会对其位置产生影响,位置更新如式(1)所示。

xi(t+1)=xi(t)+akxi(t-1)+

b|xi-xw|

(1)

式(1)中,t表示当前迭代次数,xi(t)表示种群中第i只蜣螂在第t次迭代时的位置。α为1时表示路线无偏差,-1时表示偏离原方向。xw表示种群中的最差位置,|xi-xw|用来表示光强的变化,数值越大光源越弱。k为偏转系数,b为(0,1)的一个常数值。

当处于有障碍模式时,蜣螂需要通过跳舞来获得新的前进方向,算法提出者使用了切线函数来模仿跳舞行为,得到新的滚动方向,此时位置更新表达式如式(2)所示。

xi(t+1)=xi(t)+tan(θ)|xi(t)-

xi(t-1)|

(2)

式(2)中,θ为偏转角,|xi(t)-xi(t-1)|为第t-1次和第t次的位置之差。

2.2 繁殖

蜣螂为了给后代提供安全的环境,通常会选择合适的产卵地点。因此,提出了模拟蜣螂产卵的区域边界选择策略,如式(3)所示。

(3)

Bi(t+1)=xb+b1(Bi(t)-Lb*)+

b2(Bi(t)-Ub*)

(4)

式(4)中,Bi(t)为第i个卵在第t次迭代时的位置,b1和b2是大小为1×D的独立随机向量,D为优化问题的维数。

2.3 觅食

一些蜣螂会从地下出来寻找食物,其最佳觅食区域是动态更新的,如式(5)所示。

(5)

式(5)中,R与前文相同,xg为当前种群的局部的最优位置,Ubg和Lbg分别为出来觅食的蜣螂活动范围上下界,此时出来觅食的蜣螂位置更新如式(6)所示。

xi(t+1)=xi(t)+C1(xi(t)-Lbg)+

C2(xi(t)-Ubg)

(6)

式(6)中,C1为服从正态分布的随机数,C2为1×D的属于(0,1)之间的随机向量。

2.4 偷窃

在种群中,有一些蜣螂会偷取其他蜣螂的粪球,在迭代过程中,偷窃者的位置更新如式(7)所示。

xi(t+1)=xg+Sg(|xi(t)-

xb|+|xi(t)-xg|)

(7)

式(7)中,g为服从正态分布的大小为1×D的随机向量,S是一个常数。

综上所述,与其他算法相比不同的是,它不是基于双种群的,而是基于多个子种群,每个子种群执行不同的搜索方式,算法的提出者将其划分成了四个子种群。因此,DBO算法在探索或开发方面比其他算法更具竞争力,可以利用不同时间段的信息对搜索空间进行彻底的探索,追求更强的搜索能力,以避免陷入局部最优;R参数具有动态变化的特点,可以进一步激发算法的探索和开发状态;不同的区域搜索策略,可以促进算法的利用行为;不同的更新规则,可以保证所开发的算法在局部和全局搜索能力之间保持足够的平衡。

3 DBO-LSSVM模型

LSSVM以径向基函数(RBF)为模型预测的内核,而参数的选择对模型的影响较大,人为的对参数进行确定,会使该模型的精度以及预测性能降低。而利用蜣螂优化算法来选择合适的参数,使人为选参致使的误差变大问题得以解决。参数选择的步骤如下。

(1)初始化蜣螂群和DBO优化算法运行参数初值;

(2)根据目标函数计算出所有agent的适应度值;

(3)更新所有蜣螂位置;

(4)判断每个agent是否超出边界;

(5)更新当前最优解及其适应度值;

(6)根据设定的迭代次数或结束运行条件,对

上述步骤进行循环;

(7)得到最优解。

根据以上步骤构建DBO-LSSVM预测模型如图1所示。

图1 DBO-LSSVM预测模型流程图

4 仿真实验与结果分析

4.1 优化算法对比

选择四个标准函数来验证DBO算法的有效性,F1-F3为单峰函数,F4为多峰函数,测试函数具体内容如表1所示。将DBO和灰狼优化算法(GWO)、麻雀搜索算法(SSA)、鲸鱼优化算法(WOA)、北方苍鹰优化算法(NGO)进行对比,设置每种算法种群规模为30,最大迭代次数500,在MATLAB 2022b中进行算法编程和运行仿真,每个算法独立运行30次。

表1 标准函数信息

将算法进行对比观察其收敛性能和寻优精度,取得的数据如表2所示,根据最优值和平均值来考察算法的性能。在求解函数F2时,DBO算法对比其余算法至少提高了5个数量级;在求解函数F3时,DBO算法对比其余算法至少提高了35个数量级;在求解函数F4时,均接近理论最优值。实验结果表明,DBO算法具有较好的精度和收敛性,其稳定性也相对较好。

表2 各算法对应测试结果

4.2 数据来源

使用的实验数据来自中国环境监测总站的全国城市空气质量实时发布平台发布的成都市公开数据,包括PM2.5、PM10、SO2、NO2、CO、O3和AQI指数等指标。除此之外,使用成都市2021年3月至2022年3月间的每天的数据作为数据集,按照7:3来划分训练集和测试集在MATLAB R2022b软件上进行仿真实验。

4.3 评价指标

使用决定系数R2(coefficient of determination)平均绝对误差MAE(mean absolute error)和均方误差MSE(mean square error)三种评估指标来更好的对模型的预测效果进行评估,如式(8)-式(10)所示。

(8)

(9)

(10)

4.4 DBO-LSSVM模型仿真

设置种群数量为30、迭代次数为50时,DBO-LSSVM模型的收敛曲线如图2所示。

图2 DBO-LSSVM模型收敛图

将处理后的数据输入模型,以七三来划分训练集和测试集,对DBO-LSSVM模型进行训练如图3所示。通过结果图可以得出结论:无论是在训练集还是测试集,曲线波动走向近乎一致,空气质量指数的预测值和真实值都非常贴近。这就说明此模型对空气质量指数的预测误差小且精确度较高。

(a)训练集对比图

4.5 模型性能分析

为验证对于空气质量指数预测,DBO-LSSVM模型是否相对具有优势,将LSSVM模型和灰狼算法优化最小二乘支持向量机模型(GWO-LSSVM)与其进行比对。将LSSVM和GWO-LSSVM和DBO-LSSVM模型在测试集上的预测评价指标进行记录,并且将三种模型预测值与真实值的拟合程度分析进行对比,如表3和图4所示。

表3 评价指标数据表

(a)LSSVM模型拟合程度图

从表3和图4中可以清晰的看出,提出的DBO-LSSVM模型的MSE、MAE值均低于另外两个模型,分别为3.5440和1.3385。其中MAE、MSE值较LSSVM模型分别降低了0.3727、3.1161;较GWO-LSSVM模型降低了0.2027、1.1568;除此之外,R2值和拟合程度分析图也均为最佳。由此可得,LSSVM模型通过DBO寻找最优参数,最终得到了更为精准的AQI预测效果。

结语

提出了一种基于蜣螂优化算法对最小二乘支持向量机的空气质量指数预测模型,蜣螂优化算法是新提出的算法,其性能优于SSA、GWO、WOA等算法。通过仿真实验证明了与其他两种模型相比较DBO-LSSVM模型不仅预测精度较高,而且速度也得到了改善,三种评价指标值皆为最佳且误差波动最小。综上所述,此模型对空气质量指数可以提供更为精确的预测,算法稳健性和预测精度较其他模型可以达到更高。

猜你喜欢
蜣螂空气质量种群
山西省发现刺五加种群分布
重读《昆虫记》系列一:勤劳的“铲屎官”——蜣螂
中华蜂种群急剧萎缩的生态人类学探讨
和蜣螂一起玩
和蜣螂一起玩
“空气质量发布”APP上线
车内空气质量标准进展
重视车内空气质量工作 制造更环保、更清洁、更健康的汽车
开展“大气污染执法年”行动 加快推动空气质量改善
鹰与蜣螂