不确定时间延迟下RMPC的保代价区域优化研究*

2015-05-29 08:22易永红林晓佳
湘潭大学自然科学学报 2015年4期
关键词:代价不确定性线性

易永红 , 林晓佳

(1.四川大学 计算机学院,四川 成都610044;2.绵阳职业技术学院 计算机科学系 四川 绵阳621000;3.福州大学 数学与计算机科学学院,福建 福州350116;4.中国科学院 北京100864)

系统在通信、测量或者计算处理过程中产生的延迟会使得系统的性能下降,或者会导致系统控制循环的不稳定[1],因此在系统控制器的设计过程中要考虑这种时间延迟.然而在实际场景中,时间延迟往往是未知的,主要由以下原因产生:不可预料的系统行为改变,操作环境的改变,组件的失效,以及通信连接的重新配置等[2].在这种时间延迟不确定的情况下,必须采取有效的控制策略来保证系统的稳定运行.为了应对上述问题,研究人员采用RMPC(Robust Model based Predictive Control)[3]技术来处理延迟的不确定性.

当系统模型中存在不确定性时,RMPC是一种滚动时域优化控制技术,其目标是在满足一定的约束条件下确保系统的稳定性[4].在预测控制系统中,大多数的稳定性措施都有一个基本的假设前提[5],即在每个时间步都可以进行系统的优化,因而系统的稳定性和约束处理是紧密相连的.在这种情况下,为了对模型进行近似处理(如线性化和降阶),健壮性在系统的设计过程中十分重要.

在典型的RMPC公式中,控制策略通过对最小值或者最大值优化问题进行在线求解,并且通过一系列不确定设备对代价函数的最坏值进行评估[6].然而,在控制器的实际部署中,实时部署的计算量相当大.为了应对这种情况,Rossi等人[7]提出了一种基于线性矩阵不等式[8]的RMPC方法,该方法应用数值解法可以在多项式时间内进行系统的最优控制.研究表明,[8]的方法可以转化为半正定规划问题,通过加入额外的线性矩阵不等式来表示系统的操作约束[9].为了较小保守型,[10~12]在[7]的基础上提出了不同的应对方法.此外,还有一些研究方法关注系统的输出反馈[5,12,13],非线性系统[14],非对称输出约束[15]等.在确定保代价区域的过程中,为了进一步分析系统中的已知和未知输入延迟,本文对[7]提出的方法进行了扩展,在系统的状态向量中包含了历史的控制值信息,提出了一种基于线性矩阵不等式的保代价区域分析方法.

1 基于线性矩阵不等式的RMPC

在不确定状态空间模型下,RMPC的公式描述为:

其中x(k)∈ℝnx和u(k)∈ℝnu分别为系统在k时刻的状态和输入变量,参数A,B∈Ω,Ω为不确定的多面体,节点为Ai∈ ℝnx×nx 和Bi∈ ℝnx×nu,i=1,2,…,L.令Cl∈ ℝ1×n(l=1,2,…,ny)为已知的约束向量,那么输出变量为yl(k)=Clx(k).令无穷时间跨度的代价函数为:

其中S∈ℝnx×nx和R∈ℝnu×nu为正定的权重矩阵,(·|k)为根据k时刻的可用信息计算得到的预测值.如果系统的状态可以直接测量得到,那么x(k|k)=x(k).

在t时刻,RMPC的优化问题可以形式化描述为:

其必须满足的约束条件为

其中ur,max和yl,max分别表示第r个输入和第l个输出的放大边界.

根据[8],代价函数J∞(k)的上届γ可以通过最小化如下所示的半正定规划问题得到:

其约束条件分别如下

此后,将预测函数F=YQ-1应用于状态反馈控制规则中,使得u(k+j|k)=Fx(k+j|k).为了简化符号的表示,在下文的论述中用P(x(k))表示公式(6)~(10)所示的半正定规划问题.

通过在滚动时域中应用控制规则(即在每个采样时刻k通过求解P(x(k))得到新的增益矩阵F),如果P(x(k))在初始时刻k=0有可行解,那么封闭环系统是渐进稳定的[8].因此,如果优化问题P(ξ)有可行解(即将x(k)替换为ξ后线性矩阵不等式(7)~(10)表示的系统存在着可行解(γ,Q >0,Y,X,Z)),那么初始条件x(0)=ξ∈ ℝnx 是可行的[7].

1.1 保代价区域分析

其约束条件除了要满足公式(8)~(11)所示的线性矩阵不等式外,还要满足

其中常数向量ξ∈ℝnx定义了极点的延伸方向.于是,可以得到极点β*ξ,并且对于不同的ξ得到凸壳的所有极点,从而得到的内部近似区域.当→∞时,上述半正定规划的解包含的区域内的所有点都为可行的初始条件,这对应于封闭环系统的原区域的吸引区域[7].令吸引区域为D,那么可以根据得到的极点构成的凸壳得到D的内部近似区域.

2 不确定输入延迟的RMPC

在(1)所示的不确定系统模型的基础上,如果令已知的输入延迟τ作为输入参数,那么可得

为了进行简化分析,假设系统仅有一个输入参数,即nu=1.此时,通过对状态空间进行放大,使其包含历史的控制信息可得,于是,状态空间方程为:w(k+1)=Aww(k)+Bwu(k),Aw∈Ωw,其中为不确定的多面体,其顶点为Awi∈ℝ(nx+τ)×(nx+τ).为了描述时间延迟的不确定性,令τ∈ [0,τ-]是未知的,其中最大时间延迟τ-是已知的,因为控制系统的最大通信延迟是已知的.于是,放大后的状态可定义为v(k)∈ℝnx+τ-:

从而,对应的状态空间方程为:

于是,多面体Ωv的顶点为当时间延迟的下届为时,令,可以得到对应的不确定模型表示.

2.1 不确定时间延迟下的保代价区域分析

在不确定输入时间延迟下,模型的保代价区域可以通过半正定规划问题相应的状态空间方程(包含状态放大约束)进行求解得到.当时间延迟已知时,令放大的状态向量为w(k)=;当时间延迟未知时,令v(k)= [x(k),u(k-1),u(k-2),…,u(k-τ-)]T.最后,根据极点得到保代价区域Dγ-的内部近似值.

在特殊情况下,如果在初始时刻k=0时,控制器的取值为u(-1)=u(-2)= … =u(k-τ-)=0,根据公式(12)令向量ξ中nx个元素后面的元素为0,那么得到的结果为原状态变量空间所对应的保代价区域.

3 仿真实验分析

3.1 实验设置

实验采用的不确定时间延迟系统为[7]所示的角度定位系统,研究的问题为电动机驱动的旋转天线的控制问题.该设备的动力学可通过如下的离散时间状态方程表示:

当执行器与控制器或者传感器分离时会产生时间延迟.系统采用通信连接进行信号的传递,当连接失效时,系统必须重新寻找更长的路由路径从而产生时间延迟.状态变量x1和x2分别表示天线的角度位置(rad)和角速度(rad/s),控制变量u为系统的输入电压(V),天线在移动过程中的摩擦用参数α表示,本文令α=0.1.为了简化分析,模型中的唯一不确定因素为时间延迟τ.代价函数的权重S和R分别为I2×2和1,控制变量u的取值限定在[-2V,+2V]之内,位置变量x1的取值范围为[-1rad,+1rad],定义输出变量为y=Cx,其中C=[1 0].

3.2 实验结果

在实验中,我们令τ=0,1和5为固定时间延迟;令τ∈[0,5]和τ∈[4,5]为不确定的时间延迟.图1和图2分别为=50和=500两种情况下保代价区域的内部近似区域,这两幅图中每个多边形都包含32个极点.经过对两幅图的对比可以看出,=50时的保代价区域小于=500时的保代价区域,这表明当初始状态值与原始值相接近时可以得到更小的代价.

图1和2所示的结果表明,当时间延迟不确定时,这种不确定性带来的性能损失比时间延迟本身还要大.为了进一步阐述上述情况,图3对比了τ=5,τ∈[0,5]和τ∈[4,5]三种情况下的.当τ∈[4,5]时,根据Av和Bv的定义系数λ0,…,λ3都为0,不确定性取决于λ4和λ5.因此,该线性矩阵不等式系统的约束要小于τ∈[4,5]时的不确定系统(λ0,…,λ5都为不确定参数).从图3可以看出,τ∈[4,5]所示的区域要大于τ∈[0,5]所示的区域,这表明准确地描述不确定时间延迟可以得到更小的代价.

4 结束语

在实际场景中,系统的时间延迟往往是不确定的,为了应对这种时间延迟的不确定性,必须采取有效的控制策略来保证系统的稳定运行.本文在传统RMPC的基础上引入了不确定时间延迟,分析了不确定时间延迟下系统的保代价区域.首先,介绍了线性矩阵不等式约束下的RMPC,并分析了相应的保代价区域.接下来,在RMPC中引入不确定时间延迟,通过对系统状态空间进行放大,使其包含了更多的历史状态信息.最后,依据最大时间延迟分析了不确定性对控制系统性能的影响,并分析了相应的保代价区域.仿真实验表明,控制系统的保代价区域随着时间延迟的增加而逐渐减小,并且时间延迟的不确定性范围越大系统的保代价区域越小.

[1]张保会,谢欢,于广亮,等.基于广域轨迹信息的多机系统暂态不稳定性快速预测方法[J].电网技术,2006,30(19):53-58.

[2]蒋友辉,卢汉成,洪佩琳,等.基于网络编码的无线多播速率选择机制[J].电子与信息学报,2012,34(5):1 202-1 207.

[3]CAMPO P J,MORARI M.Robust model predictive control[C]//American Control Conference,IEEE,1987:1 021-1 026.

[4]王明昊,刘刚,赵鹏涛,等.多胞约束LPV系统多面体不变集RMPC算法[J].控制与决策,2013,28(11):1 661-1 666.

[5]LI D,XI Y,GAO F.Synthesis of dynamic output feedback RMPC with saturated inputs[J].Automatica,2013,49(4):949-954.

[6]JALALI A A,NADIMI V.A survey on robust model predictive control from 1999-2006[C]//CIMCA/IAWTIC,2006:207.

[7]ROSSI F Q,WASCHBURGER R,GALVAO R K H.Determination of the domain of attraction and regions of guaranteed cost for robust model predictive controllers based on linear matrix inequalities[C]//Control(CONTROL),2012UKACC International Conference on IEEE,2012:982-987.

[8]KOTHARE M V,BALAKRISHNAN V,MORARI M.Robust constrained model predictive control using linear matrix inequalities[J].Automatica,1996,32(10):1 361-1 379.

[9]El GHAOUI L,FERON E,BALAKRISHNAN V.Linear matrix inequalities in system and control theory[M].Philadelphia:Society for industrial and applied mathematics,1994.

[10]CUZZOLA F A,GEROMEL J C,MORARI M.An improved approach for constrained robust model predictive control[J].Automatica,2002,38(7):1 183-1 189.

[11]WADA N,SAITO K,SAEKI M.Model predictive control for linear parameter varying systems using parameter dependent Lyapunov function[C]//Circuits and Systems.MWSCAS'04.The 47th Midwest Symposium on IEEE,2004.

[12]LEE S M,PARK J H.Output feedback model predictive control for LPV systems using parameter-dependent Lyapunov function[J].Applied Mathematics and Computation,2007,190(1):671-676.

[13]LI H,JING X,KARIMI H.Output-feedback based H-infinity control for active suspension systems with control delay[J].IEEE Transactions on Industrial Electronics,2014(61):436-446.

[14]ZHAO J C,SU C L,LI P.Robust predictive control for uncertain time-delay systems with nonlinear disturbance[C]//Advanced Materials Research,2012,490:1 496-1 500.

[15]CAVALCA M S M,GALVÃORKH,YONEYAMA T.Robust model predictive control using linear matrix inequalities for the treatment of asymmetric output constraints[J].Journal of Control Science and Engineering,2012,2012:2.

[16]孙勤,张俊彦,邹汝红.三种翼型参数化方法的研究[J].湘潭大学学报自然科学版,2013(3):34-39.

猜你喜欢
代价不确定性线性
法律的两种不确定性
渐近线性Klein-Gordon-Maxwell系统正解的存在性
线性回归方程的求解与应用
全球不确定性的经济后果
英镑或继续面临不确定性风险
英国“脱欧”不确定性增加 玩具店囤货防涨价
二阶线性微分方程的解法
爱的代价
代价
基于线性正则变换的 LMS 自适应滤波