基于KFCM和AMDE-LSSVM的软测量建模方法

2018-08-24 08:49,,,
计算机测量与控制 2018年8期
关键词:径向交叉聚类

,,,

(江苏大学 电气信息工程学院,江苏 镇江 212013)

0 引言

发酵过程涉及微生物生长繁殖,过程呈现高度非线性和不确定性;同时随着发酵进行,发酵最适条件参数随时间发生改变,使得传统的传感器方法难以实时在线检测发酵过程关键参数,从而造成无法对发酵过程进行优化控制,自动化水平远低于其他工业生产过程。因此“软测量”建模被提出和广泛应用在发酵工业中[1]。

最小二乘支持向量机(LS-SVM)建模方法采用结构风险最小化原则和核参数技术,同时建模速度较快,在解决小样本的建模过程中有很好的表现[2-5]。实践表明,LS-SVM模型过程中径向基宽度和惩罚系数对建模性能影响很大。LU 等[6]采用量子粒子群算法来完成支持向量机参数选择,并运用在发酵过程成中,取得很好测量效果;刘瑞兰等[7]提出用遗传算法对模型进行稀疏化以及参数寻优。这些算法不仅缩短了计算时间,而且降低了对初值选取的依赖度,但算法都比较复杂。差分进化(DE)算法利用随机选择的不同个体进行差分矢量运算对原始个体进行迭代优化,它是优化LS-SVM模型参数的一种合适的方法,它在收敛性和稳定性上都比其他算法有优势。随着差分进化算法迭代的进行,最优解容易陷入局部最优[8-10]。为了克服差分进化的缺陷,增加种群的规模是常用手段,该方法没有从根本上解决早熟收敛的问题,增加种群规模同时增加算法了的运算时间。为了跳出局部收敛,改善DE算法的性能,本文针对差分进化中的局部最优解和交叉概率因子进行了优化。

在发酵过程中,随着发酵过程的进行,发酵参数随之改变,单一回归模型不再适应新的工况,因此采用模糊C均值聚类(FCM)将数据划分,再建立多个模型的多模型软测量建模则显得更加合理。梅从立等[11]将FCM与高斯过程回归相结合,运用在红霉素的生产发酵中,取得很好的效果。由于传统FCM方法会导致某一聚类样本过多,而另一类过少,从而分类的有效性下降。引入正定核函数,将输入样本数据映射到高维特征空间,得到基于核的模糊C均值聚类方法解决这一问题[12]。钱晓山等[13]将KFCM和LS-SVM相结合得出一种多模型软测量建模方法,运用在蒸发过程的软测量中,证明了KFCM对数据分类的有效性。陈贵华等[14]将多模型软测量方法运用在乙烯裂解过程中,证明了多模型方法具有更好的精度和泛化能力。

本文将核模糊C均值聚类算法与AMDE-LSSVM相结合,提出的方法应用于秸秆发酵生产燃料乙醇过程中关键参量的测量,建立一种多模型(KFCM-AMDE-LSSVM)秸秆发酵过程软测量模型,通过实际发酵工厂进行离线采集的数据,进行了软测量仿真实验。

1 算法描述

1.1 核模糊C均值聚类

假设存在样本集:X={x1,x2,…,xn},创建聚类c,对于数据中与样本集X相似的为一组;不相似的尽可能不在一组。通过求目标函数的最小值J来对数据进行分类[15-16]。

(1)

(2)

其中:c为聚类个数,vj为聚类中心,uij为数据xi对第j个聚类中心的隶属度值,m为加权数。

引入非线性映射φ:x→φ(x),特征空间的样本距离定义为:

‖φ(xi)-φ(xj)‖2=K(xi,xj)+K(vj,vj)-2K(xi,vj)

(3)

其中:K为核函数。这里讨论一种条件正定核:

K(x,y)=-(‖x-y‖2+b2)1/2,b∈R

(4)

令b=1,将正定核引入式(3),可得目标函为:

(5)

构造拉格朗日函数,分别对v,u求偏导,得到的vj和U的更新公式如下:

(6)

1.2 基于AMDE-LSSVM的建模方法

1.2.1 最小二乘支持向量机

给定数据集{(xi,yi)|i=1,2,3....l},xi∈Rn为n维样本输入,yi∈R为样本输出。通过对样本数据逼近,函数拟合问题可以描述为最优化问题[17-18]:

(7)

式中,C为惩罚系数,e为允许误差。引入拉格朗日算子对上式求解,得到

(8)

根据KKT条件,式(8)的一阶导数为:

(9)

式(9)消去变量w、e,得线性方程组:

(10)

Q=[1,…,1]T,a=[a1,a2,…,al]T,y=[y1,y2,…,yl]T,

K为核函数矩阵。根据Mercer条件可以得核函数为:

K(xi,xj)=φ(xi)Tφ(xj)

(11)

综上可以得到最终输出为:

(12)

采用径向基函数(RBF):

(13)

其中:σ为径向基宽度。

1.2.2 差分进化算法

差分进化算法是一种保留最优的贪婪算法,它由变异、交叉和选择操作组成[19-20]。

(14)

其中:F为缩放因子。h1,h2,h3∈(1,2,…,NP)是互不相同且与i不同的随机数。

(15)

其中:CR为范围在[0,1]之间的交叉算子,rand(j)为[0,1]之间的随机数。

3)在选择操作中,按式(16)选择新的种群个体。

(16)

其中:f(·)为目标函数。

1.2.3 自适应变异差分进化

本文选择DE/best/2/bin策略。个体变异操作的方程为:

(17)

1.2.3.1 自适应二次变异思想

定义1 群体适应度方差为:

(18)

fi为第i个个体的适应度,favg显示适应的程度,式中,f中是归一化定标因子,其作用是限制群体适应度方差的大小,具体公式如下:

(19)

(20)

1.2.3.2 时变交叉概率因子CR。

由DE交叉操作可知,在搜索初期需要保持全局搜索能力,从而需要较小的CR,保持种群的多样性;搜索的后期因已确定最优范围,需要对局部进行精确搜索,从而需要较大的CR以保证搜索后期的搜索速度[9]。基于这种思想,在前期设定较小交叉概率因子CR,随着搜索时间的增加而加大交叉概率因子CR。本文时变交叉概率因子CR由下式得到:

(21)

在算法设定初始交叉概率CRmin和最大交叉概率CRmax

1.2.4 基于AMDE-LSSVM建模

在LS-SVM中,惩罚系数C和径向基宽度σ对模型的泛化能力有着很大的影响,因此寻求模型最佳惩罚系数与径向基宽度是十分重要的。本文利用AMDE对LS-SVM建模中的参数进行选择。

AMDE-LSSVM软测量建模步骤如下:

2)初始化种群NP、变异算子F、最大迭代次数Gmax、初始交叉率CRmin、最大交叉概率CRmax、终止阈值、惩罚系数C和径向基宽度σ的上、下值。令G=0,根据C和σ的上、下限产生一组随机的[C1,σ1]。

5)G=G+1。

6)对[C,σ]进行变异、交叉、选择操作。产生新的[C,σ],返回步骤3)。

7)得到最优惩罚系数C和径向基宽度σ作为建模参数,进行软测量建模。

1.3 基于KFCM和AMDE-LSSVM软测量建模

基于KFCM和AMDE-LSSVM软测量建模思想在于:利用核模糊C均值聚类算法的有效分类,将采集的样本数据集X分成{Xi|i=1,2,…,c},c个聚类。对每一个Xi分别采用AMDE-LSSVM进行训练,得到每一类的输出为:

(22)

采用模糊隶属度来综合最后的结果:

(23)

式中uik为第k个样本对应的第i类模糊隶属度,fi(x)为第i个子模型。

秸秆发酵关键参量的多模型软测量建模如图1,步骤可如下描述:

步骤1:对采集数据进行预处理。

步骤2:将处理后的样本用核模糊C均值聚类进行划分为c个不同的子集。

步骤3:对每个聚类的样本运用AMDE-LSSVM进行建模,得到c个秸秆发酵关键参量软测量子模型。

步骤4:求得各个隶属度,由式(19)得到最终的多模型软测量输出。

图1 建模过程

2 实验仿真

我国是世界上农作物秸秆类资源最多的国家,2015达到10.4亿吨,其中20%为二次利用,而剩余大部分以堆积焚烧的方式处理。就地焚烧的处理方法,不仅给环境带来极大污染,而且浪费了秸秆类资源的生物质能量。通过发酵的方式得到可保存的气体或液体燃料,例如酒精、氢气、柴油等,热效率提升20%以上[22-23]。这样不仅解决了污染问题,而且使农民得到了创收。近年来,秸秆发酵制取燃料乙醇规模化成为研究的热点。乙醇浓度、总糖浓度、菌体浓度是观察秸秆发酵过程的重要参数,但是无法通过物理传感器检测,制约了自动化水平的提升。因此将本文设计的多模型软测量方法用于秸秆发酵的关键参量的测量中。

在建立秸秆发酵关键参量软测量之前,必须对发酵机理进行分析,选取合适的辅助变量。秸秆发酵过程如图2所示。根据课题组已有的成果选取:溶解氧、发酵液酸碱度、电机搅拌速度、空气流量作为辅助变量。按照工艺要求,过程中罐温控制在36 ℃±1 ℃,搅拌机转速控制在120~180 r/min,通气量为0.2 L/min,发酵罐压控制在0.2 MPa±0.01 MPa。每隔1 h取样并离线采集化验乙醇浓度、总糖含量、菌体浓度。总共采集10批数据,其中前9批数据作为训练数据,另外1批数据作为测试数据。软测量模型建立完毕后,利用C语言编程实现,并嵌入到计算机中,当待预测罐批的输入向量,经测量仪表读入计算机后,利用软测量程序计算得到关键状态变量的预测值,并将预测结果经数据通道传送到计算机上显示,供操作人员进行观察和控制发酵过程。

图2 秸秆发酵过程

3 仿真结果与分析

设定分类个数c=3,加权数m=2,求出不同类相应的聚类中心v和隶属度矩阵U。应用AMDE-LSSVM建立3个子模型。模型1的惩罚系数C=101.56,径向基宽度σ=5.65;模型2的惩罚系数C=45.88,径向基宽度σ=18.467;模型3的惩罚系数C=78.19,径向基宽度σ=2.678。多模型输出采用隶属度加权策略。表1为几种优化算法对比,表中的数据可见,AMDE算法在选择LS-SVM的核参数优于交叉验证和传统DE算法,证明了AMDE算法的全局寻优能力。对比3种寻优方法的运行时间,AMDE和DE算法明显要优于交叉验证的方法。由于AMDE在结构上引入了时变的交叉概率因子,在算法搜索期间有不同的交叉概率因子,前期提高全局搜索能力后期提高局部搜索能力,从而加快了搜索时间。对于不同结果的标准差分析可以发现,AMDE的标准差最低,反映出设计的自适应二次变异思想有效地跳出传统DE算法的早熟收敛。

基于KFCM和AMDE-LSSVM软测量仿真结果如图5所示,图中显示了离线化验值、多模型软测量预测值和DE-LSSVM软测量预测值。从图中可以明显看出,DE-LSSVM软测量方法预测值虽然在趋势上接近离线化验值,但是在发酵前期和后期有很大的误差,这是因为在发酵秸秆发酵各个时期所表现的发酵最适条件不同,导致单一的模型失效。多模型软测量方法预测值在发酵各个阶段都表现出了良好的拟合精度,误差更小,这是因为多模型方法是对秸秆发酵过程进行划分得到多个模型,使得预测模型更加精确。发酵实际值与软测量值的误差如图6所示,该图进一步显示了优化后的多模型软测量方法在秸秆发酵关键参量的预测中表现更好。

表1 优化方法对比

图5 软测量结果比较图

图6 相对误差比较曲线

表2和表3是几种不同算法下的性能比较。与BP、SVM、DE-LSSVM相比,改进后的多模型软测量方法在乙醇浓度、总糖含量、菌体浓度的预测上标准误差分别只有0.64%、1.85%、0.75%,与其他单一预测方法有了明显的提高,并且训练时间大幅度降低。详细分析表2和表3中的DE-LSSVM建模和多模型建模,可以看出单一LS-SVM建模需要10.7 s,而本研究中建立3个子LS-SVM模型得到多模型虽然在时间上稍稍多于单个LS-SVM建模,但是在测量精度上要远远由于DE-LSSVM建模,可以满足实际秸秆发酵过程关键参数测量的需要。

表2 不同算法的性能比较 %

表3 不同算法的训练速度

4 结束语

针对发酵过程的复杂性、时变性,本文提出了发酵关键参量的多模型软测量建模,运用KFCM将数据划分为三类,分别建立LS-SVM模型,对于LS-SVM建立软测量模型的不精确和常规交叉方法对选择LS-SVM建模中惩罚系数C和径向基宽度σ的盲目性和耗时性问题,本文引入DE算法对LS-SVM的参数进行寻优;同时针对DE算法存在易陷入局部最优和早熟收敛问题,提出一种自适应变异差分进化(AMDE)算法,该方法采用自适应变异操作和时变交叉概率因子对DE算法进行改进优化。通过仿真实验显示可以得到合适的惩罚系数C和径向基宽度σ,并且提高了训练的速度,最终得到的预测值的准确率有了明显的提高。然而,本文算法的一个局限性就是使用的传统KFCM算法对初始聚类中心初始值的设定的过分依赖性,通常的聚类算法往往对于不同的初始聚类中心会得到不同的聚类结果;二是需要预先设定聚类数目,这增加了算法的不确定性。因此下一步的研究方向可以针对这两个问题进行开展。

猜你喜欢
径向交叉聚类
一种傅里叶域海量数据高速谱聚类方法
菌类蔬菜交叉种植一地双收
双级径向旋流器对燃烧性能的影响
“六法”巧解分式方程
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
新型非接触式径向C4D传感器优化设计
一种可承受径向和轴向载荷的超声悬浮轴承
连数
连一连