基于变量选择的电站燃煤锅炉NOx排放浓度预估

2023-11-03 11:34王珑宪赵文杰
计量学报 2023年10期
关键词:互信息预估时延

王珑宪, 赵文杰

(华北电力大学 控制与计算机工程学院,河北 保定 071003)

1 引 言

电厂燃煤锅炉燃烧产生的氮氧化物对环境有较大危害[1]。现有的烟气在线监测系统存在测量滞后,从而导致选择性催化还原技术(selective catalytic reduction,SCR)脱硝系统喷氨控制效果不理想,因此需对锅炉NOx浓度进行在线预估。

由于电厂燃烧过程复杂,存在着大量的干扰变量,难以采用机理方法建立准确的NOx排放模型。随着机器学习的发展,越来越多的基于数据驱动的建模方法被提出,李忠鹏使用误差反向传播(back propagation,BP)神经网络进行NOx排放浓度建模并使用粒子群算法对BP网络参数进行优化[2];牛培峰使用极限学习机算法建立了NOx浓度预估模型[3];张京使用相关向量机对锅炉NOx进行建模并引入万有引力优化模型参数[4];Hao Z等使用支持向量机建模并使用粒子群优化算法对一次风速和二次风速进行调节降低了NOx排放量[5];顾艳萍对电站锅炉NOx浓度建立了最小二乘支持向量机的模型[6];王广龙采用最小二乘支持向量机建模并使用遗传算法对其超参数进行寻优[7];Zhai Y等使用构建了遗忘因子的最小二乘支持向量机建立了电站NOx浓度模型[8]。虽然传统人工神经网络在相关领域内被广泛使用,但是由于其结构问题,容易导致局部收敛。

基于此,长短期记忆网络(long short-term memory, LSTM)被提出,其特有的3个“门”结构可以自动获取输入与输出数据之间的关联性,对于处理时序数据有着天然的优势。其中遗忘门和记忆门分别负责遗忘和记忆部分信息,输出门则是最终的网络输出,该网络解决了传统神经网络梯度传播过程中的梯度消失问题,有效缓解了传统神经网络容易局部收敛的问题。杨国田采用LSTM网络建立了NOx预估模型[9];杨蓉采用遗传算法优化了LSTM网络的参数,提高了模型的预测能力[10]。

除了建模方法,特征选择也会影响模型的预测能力。特征选择常见的方法有过滤式(filter)、封装式(wrapper)和嵌入式(embedded)3种[11]。其中过滤式方法与后续学习器之间独立,运算速度快,适用于大规模数据集。该方法使用特定的相关度量手段选出与输出相关性大的特征并剔除冗余特征,李京采用互信息(mutual information,MI)筛选辅助变量,提高了模型精度[12]。李梓瑞采用最大相关最小冗余(max-relevance and min-redundancy,MRMR)算法对火焰识别的特征进行降维提高了模型精度[13]。上述方法均属于过滤式算法,即只考虑了输入,并未考虑后续学习器的影响。由于电站数据量庞大,使用过滤式特征选择算法不仅可以节省运算时间,且其与后续学习器无关,可以更好地检验算法的有效性。

本文提出基于互信息(MI)与长短期记忆网络(LSTM)相结合的NOx预估模型。考虑到电站燃煤系统各变量存在非线性、变量间相互耦合等问题,首先利用互信息算法计算出输入变量与输出变量的延迟时间,确保了输入数据的时序准确性;其次采用MRMR算法对输入变量进行选择得到最优特征子集,解决了输入变量间存在冗余性的问题;最后将最优特征子集作为LSTM模型的输入,采用某电厂的运行数据进行了模型仿真,仿真结果表明,所建MI-MRMR-LSTM模型能够有效提高锅炉NOx排放浓度的预测精度。

2 模型输入变量的选择方法

2.1 基于互信息的时延估计

锅炉的燃烧过程十分复杂,影响锅炉产生NOx的原因也有很多[14]。煤粉燃烧过程如图1所示。

图1 煤粉燃烧过程Fig.1 Pulverized coal combustion process

根据电站锅炉燃烧的机理分析可知[15],负荷、总风量、氧量、总一次风、总二次风、各个磨煤机煤量及其一次风量、一次风煤比、二次风煤比、燃尽风门开度、总燃料量等都会影响锅炉NOx的生成量。因此,将上述影响因素作为模型的初选输入变量。

根据NOx生成机理分析可知,NOx浓度与各初选输入变量间存在测量的滞后,且考虑到锅炉燃烧过程的非线性、耦合性等因素,为保证输入数据的时序准确性,采用互信息方法计算两个变量间的关联度,并进行时延估计。

互信息是信息论里常见的信息度量方法[16],可以描述两个变量之间的关联度,且该方法不受其是否为线性的影响。两个变量的互信息公式如下:

(1)

当X,Y相互独立时,p(x,y)=p(x)p(y),I(X;Y)=0。其中,p(x,y)为变量x和变量y的联合分布;p(x),p(y)为边缘分布;互信息I(X;Y)是联合分布p(x,y)和p(x)p(y)的相对熵。

使用互信息计算NOx浓度与初选输入变量的延迟时间[17]。延迟时间分析描述如下:将上述初选输入变量:负荷、总风量、氧量、总一次风、总二次风、各个磨煤机煤量及其一次风量、一次风煤比、二次风煤比、燃尽风门开度、总燃料量定义为X={X1(t),X2(t),…,X20(t)},NOx浓度为输出变量Y=Y(t),t为取值时间,每个候选变量与NOx浓度的时延都是不同的,针对每个变量Xi(t),i∈[1,20]进行相空间重构。

对Xi(t),i∈[1,20],嵌入时间延迟τ,τ=(τ1,τ2,…,τd),τ值的大小和范围由采样周期和锅炉燃烧流程确定,得到该变量嵌入时间迟延后的向量为:

Xi={Xi(t-τ1),Xi(t-τ2),…,Xi(t-τd)}

(2)

根据式(1)、式(2)计算嵌入时间迟延后的各候选输入变量与输出变量的互信息值:

I(Xi(t-τh);Y),τh∈τ

(3)

取式(3)值最大时的τ值,其对应的时间即是该候选输入变量的迟延时间。将候选输入变量与输出变量进行时间序列匹配,假设当式(3)值最大时的τ为τh,进行时序匹配即Xi(t-τh)=Di。

定义匹配后的候选输入变量集为D={D1,D2,…,D20}。

2.2 基于MRMR算法的输入变量选择

经第2.1节分析得到考虑纯迟延后的输入变量集D={D1,D2,…,D20},将该变量集作为MRMR算法的输入变量筛选出模型的最终输入变量。

MRMR算法[18]是一种既能使特征变量和目标变量之间相关性最大,又保证了特征变量间冗余性最小的过滤式特征选择算法。变量间的关联度采用互信息公式计算。

传统MRMR算法需要预设待选变量,待选变量数目的选取会影响模型预测精度。在传统的MRMR算法(步骤1~步骤5)的基础上引入了相关性判断(步骤6)作为变量选择的条件以解决MRMR算法需要预设待选变量数的问题。

步骤1:定义fi是由m个样本组成的特征向量,fi=[f(i,1),f(i,2),…,f(i,m)]T,通过式(1)计算I(fi;fj)得出候选特征之间的相关性,其中i,j∈[1,n],n为特征向量的数量。

步骤2:定义为输出类别,通过式(1)计算I(fi;O)得出特征与输出类别之间的相关性。

步骤3:使用最大相关性公式maxDc(S;O),选出与类别O关系最密切的特征。其中:

(4)

式中:|S|为特征子集S的特征数量。

步骤4:选出|S|个特征后,使用最小冗余公式minR(S),去除S中的冗余向量,其中:

(5)

步骤5:综合上述式(4)、式(5),MRMR算法的计算公式为:maxθ(Dc;R),其中:

θ=Dc-R

(6)

上述方程可通过逐渐增加单个变量来求解,式(7)为MRMR算法的评价函数。

(7)

其中集合F为全部特征集,SN-1为已经选出的N-1个特征的特征集,下一步需要在{F-SN-1}特征集合中选取第N个特征,使式(6)中的θ(·)最大。也即通过式(7)最大化单变量相关性和冗余度的差值来确定添加的第N个特征。

步骤6:引入相关性判断作为变量选择的条件;变量的相关性可通过式(8)判断。

I(fi;O)<δ×I(O;O)

(8)

式(8)中δ为相关性阈值;δ∈[0,1],若I(fi;O)<δ×I(O;O),则认为该变量不包含类别O的信息,将其判定为不相关变量。

图2为改进的MRMR算法流程图。

图2 改进的MRMR算法Fig.2 Improved MRMR algorithm

图3 LSTM网络结构Fig.3 LSTM network structure

筛选变量具体流程:

1)计算全部的特征与输出类别的互信息并按照互信息值大小排序

2)选取互信息最大的特征作为第一个变量加入集合S。

3)通过式(8)判断是否结束选取,若不满足则继续寻找下一个特征,若满足条件则输出集合S。

4)寻找在{F-S}中使评价函数式(7)最大的特征加入集合S。

5)重复第3)~4)步。

3 MI-MRMR-LSTM模型

3.1 LSTM模型

经第2.2节MRMR算法选择后的变量作为LSTM模型的输入变量。

LSTM网络是一种特殊的循环神经网络(recurrent neural network, RNN),能捕捉数据中的长期依赖关系[19]。标准的RNN网络虽然建立了不同时刻隐藏层之间的关系,但由于其内部结构单一,在处理长时间序列问题时效果并不理想。与标准的RNN相比,LSTM不仅有对短期记忆ht的敏感特性[20],又有专门保存长期信息的单元状态ct。

LSTM结构如下图所示:下图中每层LSTM的输入有3个,分别为:t时刻的网络输入值xt,t-1时刻的LSTM输出层ht-1,t-1时刻的单元状态ct-1;输出有两个,分别为:t时刻LSTM的输出ht,t时刻单元状态ct。

LSTM网络的计算公式如下:

ft=σ(wf[xt,ht-1]+bf)

(9)

it=σ(wi[xt,ht-1]+bi)

(10)

(11)

ot=σ(wo[xt,ht-1]+bo)

(12)

(13)

ht=ottanh(ct)

(14)

其中,在t时刻下:式(9)为遗忘门,负责遗忘部分信息,有助于获取时间序列短期的关系。式(10)和式(11)为记忆门,负责记忆部分信息,有助于获取时间序列长期的关系。式(13)为细胞状态的更新。式(12)和式(14)为输出门的公式,w和b代表各个门的权重系数和偏置。

3.2 MI-MRMR-LSTM预测模型

基于MI-MRMR-LSTM预测模型的构建主要分为4部分,分别是通过电站燃烧的机理分析初步确定候选输入变量、候选输入变量与输出变量NOx浓度之间时延关系的确定、在候选输入变量中确定最佳输入变量与LSTM模型的构建。

对基于MI-MRMR-LSTM模型的电站NOx浓度预估算法进行具体描述如下:

1)通过机理分析初步筛选与锅炉出口NOx有关的变量作为候选输入变量。将候选输入变量定义为X={X1(t),X2(t),…,X20(t)},NOx浓度为输出变量Y。

2)对每个变量Xi(t),i∈[1,20]进行相空间重构得到式(2),根据式(1)、式(2)、式(3)将每个候选输入变量Xi(t),i∈[1,20]与输出变量Y进行时序匹配,得到匹配后的候选输入变量集D={D1,D2,…,D20}。

3)将新的候选变量集合D={D1,D2,…,D20}作为MRMR算法的输入,得到最优特征子集。

4)将输入传递给LSTM模型进行预测。

4 NOx排放浓度预测实验设计

以某电厂350 MW机组作为研究对象。该机组采用的是一次中间再热、超临界压力变压运行直流锅炉,每台锅炉配备5台磨煤机,4运1备。

通过2.1节分析选取负荷、总风量、氧量、总一次风、总二次风等共20维变量作为候选输入变量,输出变量为锅炉出口NOx浓度。原始数据为6 000组,采样周期为10 s。

4.1 时延计算结果

根据锅炉燃烧机理分析将最大时延τd设置为600 s,故τ=(10,20,…,600)。

根据式(2)、式(3)计算得到各候选变量迟延时间如表1所示。

表1 各候选变量的迟延时间Tab.1 The delay time of each candidate variable

4.2 输入变量选择结果

将新的候选输入变量集D={D1,D2,…,D20}作为MRMR算法的输入,Y作为输出响应变量,设定相关性阈值δ为0.1。选出的变量结果如表2所示。

表2 所选输入变量集Tab.2 Set of selected input variables

MRMR算法目的是保证已选变量与响应变量Y之间相关性较大,且已选变量之间相关性较低。图4 和图5可以更直观地展示算法的可行性。已选变量和响应变量之间的互信息如图4所示。

图4 已选变量和响应变量之间的互信息Fig.4 Mutual information between selected and response variables

图5 已选变量之间的互信息Fig.5 Mutual information between selected variables

已选变量之间的互信息如图5所示。

通过图4可以看出已选变量和响应变量之间的互信息较高,通过相关性判断(式(8))可知已选变量与响应变量之间具有相关性。通过图5可以看出已选变量间的互信息较低,通过相关性判断(式(8))可知已选变量间不具备相关性,进一步说明了MRMR算法的可行性。

4.3 NOx预估模型的建立

为了方便衡量不同情况下预测的效果,本文采用平均绝对误差(MAE)和均方根误差(RMSE)作为模型评价指标。

其公式如下:

(15)

(16)

由于变量的重构,引入了纯迟延,经第4.1节计算迟延可知,延迟时间最大的变量为总燃料量和各个磨煤机给煤量,时长为200 s,建模的实验数据需从原始数据的第21组开始,共5 980组数据,前5 480组作为训练,后500组数据作为测试。LSTM网络参数保持一致:最小训练批次为64,初始学习率为0.005,隐含层数为2,隐含层节点数为64,设置最大训练轮数为300。

为验证本文方法的有效性,将原始数据建模的模型(LSTM)、基于互信息时延估计的模型(MI-LSTM)、基于互信息时延估计的MRMR算法变量选择的模型(MI-MRMR-LSTM)共3个模型作对比。

建立以上3个燃煤锅炉NOx排放模型,测试集结果如图6所示。

图6 模型测试结果Fig.6 Model test results

由图6可知,经过时延估计建立的NOx浓度预估模型MI-LSTM,MI-MRMR-LSTM,与未经时延估计建立的NOx浓度预估LSTM模型相比,其预测结果更贴近实际值,可以更好地反应出NOx浓度的变化趋势,说明时延估计对模型精度有较大影响。

分析图6放大窗口可知,在区间450~500,MI-LSTM和LSTM模型均未跟踪真实值,而MI-MRMR-LSTM模型相比之下快速的跟踪了真实值,能更好地反映出NOx浓度的变化趋势。

由表3得知,通过比较进行时延估计的两种建模方法,MI-MRMR-LSTM的模型精度要好于MI-LSTM,进一步说明改进的MRMR算法选出变量后的建模方法较未经变量选择的建模方法效果要好。说明本文通过改进MRMR算法筛选出的输入变量具有更高的精度,泛化能力更强。

表3 不同模型测试集误差Tab.3 Test set error of different models

5 结 论

由于电站燃煤锅炉的NOx测量仪器存在着一定时间的滞后,针对此种情况对NOx进行在线预估,本文针对各个辅助变量时间滞后的情况,首先采用互信息计算候选变量的时延,其次引用相关性判断准则改进传统的MRMR算法,然后将引入时延后的候选变量采用改进的MRMR特征选择方法得到最优特征子集,提高了模型精度,避免了盲目的选择变量,将最优特征子集作为LSTM模型输入建立了燃煤电厂NOx的预估模型。仿真结果表明,MI-MRMR-LSTM模型预测精度高于LSTM模模型和MI-LSTM模型,准确的预测锅炉NOx出口浓度可以为电厂脱硝控制奠定基础。

猜你喜欢
互信息预估时延
美国银行下调今明两年基本金属价格预估
基于GCC-nearest时延估计的室内声源定位
基于改进二次相关算法的TDOA时延估计
FRFT在水声信道时延频移联合估计中的应用
基于分段CEEMD降噪的时延估计研究
史密斯预估控制在排焦控制中的应用
基于互信息的贝叶斯网络结构学习
联合互信息水下目标特征选择算法
改进的互信息最小化非线性盲源分离算法
基于增量式互信息的图像快速匹配方法