基于全驱系统方法的高阶严反馈系统时变输出约束控制

2024-03-04 02:04蔡光斌肖永强胡昌华杨小冈凡永华
自动化学报 2024年2期
关键词:反馈系统有界时变

蔡光斌 肖永强 胡昌华 杨小冈 凡永华

实际系统由于安全和性能方面的要求,以及一些物理器件的限制,会不可避免地受到各种约束条件的限制,如果约束条件得不到满足,系统性能将可能急剧下降甚至出现不稳定.为满足实际应用需求,有必要研究系统在不同约束条件下的控制问题.常见的约束条件包括: 输出约束、状态约束和输入约束等,其中输出约束是指系统输出需满足特定的约束条件.现有的输出约束控制方法主要有模型预测控制[1]、参考轨线调节[2]以及基于不变集的方法[3]等,但这些方法均基于数值计算,计算量较大.与这些方法不同,基于障碍Lyapunov 函数(Barrier Lyapunov function,BLF)的设计是处理输出约束问题的一种常用的方法,其基本思想是当自变量的值趋于某些区域边界时,BLF 的值趋于无穷大,通过保证BLF 的有界性,进而使系统输出满足约束条件[4].经过近些年的发展,所研究的问题由对称常值输出约束问题[4]发展到非对称时变输出约束问题[5],应用方面也包括在直升机系统[6]、航天器交会对接[7]等领域的实际应用.然而,大多数基于BLF的输出约束控制方法,需要将输出约束问题转换为系统跟踪误差约束问题,会造成系统输出初始值较为保守的问题.

针对上述问题,有学者提出了基于非线性转换函数的输出约束控制方法,将输出约束问题转换为非线性转换函数的有界性问题,即无需将其转换为跟踪误差约束问题,设计过程较为简单,且系统输出初值可以在整个约束区域内选取,放宽了对系统输出初值选取的要求[8-9].基于这一方法,学者们研究了严反馈系统、切换系统、随机系统、纯反馈系统、MIMO (Multiple-input and multiple-output)系统等定常输出约束以及时变输出约束控制问题[8-14],同时在应用方面也研究了四旋翼飞行器[15]、机器人[16]等实际系统的输出约束控制问题,在这一领域取得了较多的研究成果.

然而,上述方法是应用一阶系统方法(状态空间方法)进行研究的.由于牛顿定律、拉格朗日定律、角动量定律等物理定律的应用,大多数实际系统最初被建模为二阶或高阶形式.文献[17-20]指出,当采用一阶系统方法设计控制器时,需要对二阶或高阶系统降阶,将其转化为一阶系统,这样会破坏系统的全驱特性、增大系统阶数、增加控制器的设计步骤.针对这一问题,有学者提出了全驱系统方法,该方法直接对高阶系统设计控制器而不需要降阶,通过设计伪线性状态反馈控制律,将闭环系统转化为具有特定结构的线性定常系统,并基于参数化设计方法配置闭环系统的特征多项式系数矩阵实现期望的系统特性,从而满足系统控制需求[17-20].

目前,基于全驱系统方法,在自适应控制、最优控制、预测控制、故障诊断、亚全驱系统控制[21-27]等领域取得了较多的研究成果,且都具有良好的控制效果.同时全驱系统方法也出色应用到了航天器制导、控制,以及飞行器制导控制一体化[28-30]等领域.尤其针对高阶严反馈系统,文献[31-33]基于全驱系统方法提出高阶反步法,不需要将高阶系统转化为多个一阶子系统,所需推导的步骤少,过程简洁高效.同时,在其基础上,文献[21-22,34]进一步研究了高阶严反馈系统动态面、指令滤波控制等问题.上述工作取得了较多的研究成果,但尚未考虑系统输出约束控制问题.文献[35]研究了高阶严反馈系统的输出约束问题,但其研究的是基于BLF的对称常值输出约束控制问题.

由于许多实际系统的状态参数和控制参数是时变的,因此研究时变输出约束更具有一般性.受上述研究工作的启发,本文研究高阶严反馈系统的非对称时变输出约束控制问题,旨在实现直接对高阶系统设计控制器,而不需要将其转化为一阶系统.本文提出的高阶自适应动态面输出约束控制方法具有以下特点:

1)不同于状态空间框架下一阶严反馈系统的输出约束问题,本文针对高阶严反馈系统,研究其输出约束问题.基于全驱系统方法,直接研究高阶系统,不需要将其转化为一阶系统,减少了控制器设计的步骤,从而减轻计算负担.

2)与基于BLF 的输出在对称常值约束下的控制问题相比,本文在其基础上进一步研究输出在非对称时变约束下的控制问题.非对称时变约束相比于对称常值约束更加复杂,更具一般性.且与基于BLF 的方法相比,本文基于非线性转换函数的方法能够将系统输出初值可行区间扩大为整个约束区间,避免了系统输出初始值较为保守的问题.

本文结构安排如下: 第1 节是问题描述,介绍不确定高阶严反馈系统,并给出一些必要的假设和引理;第2 节和第3 节分别给出高阶自适应动态面输出约束控制器的设计和稳定性证明,从理论上证明系统输出约束得到满足,且闭环系统所有信号是一致最终有界的;第4 节基于柔性关节机械臂系统进行仿真,验证本文所提出控制方法的有效性;最后,在第5 节给出本文的结论.

为了简化表达,定义一些符号如下:λmin(Pi) 和λmax(Pi) 分别表示矩阵Pi的最小和最大特征值.矩阵Pi>0 表示矩阵Pi是一个正定对称矩阵.以及

1 问题描述

考虑含有模型不确定性的高阶严反馈系统[33]

其中,F1(t) 和F2(t) 为已知时变约束边界函数.

注 1.在工程实际中,根据物理定律建模得到的系统模型一般是高阶的,因此本文研究的高阶严反馈系统(1)相比于传统一阶形式的严反馈系统更贴近于物理实际.同时,全驱系统方法是基于系统的全驱特性直接对原始的高阶系统模型设计控制器,而不需要将其转化为一阶形式.针对高阶系统(1),本文无需将其转化为一阶形式,直接对每个高阶子系统设计控制器,尤其对反步法而言,更少的设计步骤更有利于降低算法的复杂度.

本文控制目标是: 设计高阶自适应动态面控制器使得系统(1)输出在满足约束条件(2)的情况下有效跟踪期望的参考信号,闭环系统所有信号都是一致最终有界的,且跟踪误差能够收敛到零附近的足够小的邻域内.

为实现本文控制目标,给出必要的假设以及引理.首先,系统(1)需要满足如下的全驱系统假设.

假设1[33].≠0,j=1,2,···,n.

假设2[9,13,21].期望的参考信号yd(t) 是光滑且可以得到的,并满足

假设4[9,13].约束边界函数F1(t) 和F2(t) 以及其导数(1≤i≤n) 是连续且有界的.

注2.假设1 为全驱系统假设,相比于传统一阶严反馈系统要求控制增益非零,高阶严反馈系统也要求控制增益非零.假设2 要求期望的跟踪信号及其各阶导数是连续有界的,在状态空间框架下的动态面控制方法同样要求跟踪信号及其各阶导数连续可导,这个假设也是容易实现的.假设3 是为了保证约束上下边界不交叉,且期望的跟踪信号在约束边界内,这是符合工程实际的.假设4 要求约束边界函数及其各阶导数连续有界,也是合理的.

本文中,通过选取A0~n-1使得矩阵Φ(A0~n-1)是Hurwitz 的.为了方便后续控制器设计,给出如下引理.

引理 1[33].对任意μ>0,存在A0~n-1使得

进一步可得存在正定对称矩阵P(A0~n-1),使得

根据文献[9]和文献[13],引入如下非线性转换函数

在系统输出初值在区间D1内确保ζ1(0) 有界的前提下,只需设计控制器使得ζ1在[0,∞) 内有界,输出约束条件(2)就能始终得到满足.

对转换函数式(5)求导可得

将式(9)与式(6)结合可得

进而将含有输出约束的原系统(1)转化为如下系统

当系统输出初始值在D1内,只需设计控制器使得系统(11)的第1 个状态ζ1有界,则原系统(1)的输出约束就能得到满足[9,13].

2 控制器设计

针对输出受时变约束的不确定高阶严反馈系统(1),基于全驱系统方法[21,33],设计高阶自适应动态面控制器,主要步骤如下.

步骤1.定义如下坐标变换

在区间 Ωd内是一个连续的有界函数.

定义

虚拟控制律x1d通过一系列低通滤波器[21]得到x1c

其中,ω10=x1d,ω1(m1-1)=x1c,设计的滤波参数α1i>0,i=1,2,···,m1-1 为常值,初值ω10(0)=ω11(0)=···=ω1(m1-1)(0).

定义滤波误差为

可以得到

以及

选取Lyapunov 函数为

对式(19)求导,可得

取虚拟控制律为

其中,k0>0 为一常数,则可得

由式(14)可得

虚拟控制律x2d通过一系列低通滤波器得到x2c

其中,ω20=x2d,ω2m2=x2c,设计的滤波参数α2i>0,i=1,2,···,m2为常值,初值ω20(0)=ω21(0)=···=ω2m2(0).

定义滤波误差

进一步可得

取虚拟控制律为

其中,矩阵P1为引理1 中描述的正定矩阵.

对式(35)求导,结合式(34),并根据引理1 可得

式中,下标L表示相应矩阵的最后一列.

对式(31)求导,可得

对式(39)求导,可得

取自适应律为

其中,常值γ1>0 为设计参数,进一步可得

其中,虚拟控制律x(i+1)d通过一系列低通滤波器得到x(i+1)c

其中,ω(i+1)0=x(i+1)d,ω(i+1)mi+1=x(i+1)c,设计的滤波参数α(i+1)j>0,j=1,2,···,mi+1为常值,初 值ω(i+1)0(0)=ω(i+1)1(0)=···=ω(i+1)mi+1(0).

定义滤波误差为

进一步可得

进一步可得

取虚拟控制律为

对式(52)求导,可得

对式(48)求导,可得

取自适应律为

其中,γi>0 为设计参数.进一步可得

步骤 n.

进一步可得

取控制律为

对式(63)求导,可得

对式(59)求导,可得

取自适应律为

其中,γn>0 为设计参数,可得

3 稳定性证明

结合第2 节中的控制器设计过程,给出定理1,并根据Lyapunov 理论给出其证明.

定理 1.考虑满足假设1~4 下的具有时变输出约束的高阶严反馈系统(1).由虚拟控制律(23),(33),(50),控制律(61),自适应律(41),(57),(68),组成的高阶自适应动态面输出约束控制,能够使闭环系统所有信号是一致最终有界的,系统输出满足时变约束条件,并能有效跟踪期望的参考信号,且跟踪误差可通过调整参数收敛到零附近足够小的邻域内.

证明.

定义

则可以得到

由假设3 以及式(7)可知,σ1>0,根据Young's不等式可得

结合式(71)和式(72),可得

且有如下不等式成立

进一步可得

且结合如下不等式

因此,只需设计参数满足

其中,κ>0 为一常数.进一步可得

其中

对式(86),若选取参数满足κ≥ε/V(0),则≤0.所以对任意t≥0,有V(t)≤V(0) 成立.因此可知 Ω 是一个不变集.根据比较原理[36]可得

因此,可得V(t) 是一致最终有界的.进一步可知,坐标转换误差zi,i=0,1,···,n,滤波误差s11,···,s1(m1-1),s21,···,s2m2,···,si1,···,simi以及参数估计误差i=1,···,n是一致最终有界的,即闭环系统所有信号都是一致最终有界的.且由于limt→∞V(t)→ε/κ,而ε不依赖于κ,所以可通过调整参数使得ε/κ足够小.由于z0=ζ1-x0c,且x0c在 Ωd内有界,所以可知ζ1有界,从而x1∈D1,即输出约束始终得到满足.定义跟踪误差为

由式(5),(12)和(13),可得

注 3.由上述分析可以看出,本文不需要将高阶严反馈系统转化为一阶形式,直接对其设计控制器,会简化一些步骤.且可通过调整设计参数使得ε/κ足够小以提高跟踪精度,然而这样会增大控制输入,因此在实际应用中,应考虑跟踪精度和控制输入之间的权衡.

4 仿真分析

为验证所提算法的有效性,选取柔性关节机械臂系统对本文算法进行仿真验证,机械臂系统模型为[37-38]

其中,q∈Rn表示连杆位置,其一阶导数和二阶导数分别代表连杆的速度和加速度,IQ ∈Rn×n是连杆转动惯量;M∈Rn和L∈Rn分别为连杆质量和长度;g为重力加速度;J∈Rn×n是电机转动惯量;θ,,∈Rn表示转子的角位移、角速度和角加速度;K ∈Rn×n表示等效弹簧弹性系数;τ∈Rn为电机控制力矩;Δ1和 Δ2表示系统模型不确定性,其表达式为 Δ1=0.1(MgLsinq+Kq) 和 Δ2=0.1K(θ-q).机械臂模型参数[37]为IQ=1(kg·m2),J=1(kg·m2),M=0.5 kg,L=1 m,K=40 (N·m·rad-1),g=10 (m·s-2).

定义x1=q,x2=θ,u=τ,可得

其中,g1=40,g2=1,f1=f10=-5 sinx1-40x1,f2=f20=40x1-40x2.θ1和θ2为系统未知的模型不确定参数,其真实值为0.1.

为验证本文方法的有效性,首先将本文方法与不考虑输出约束的自适应动态面控制方法[39]进行对比仿真.令x1=q,x2=,x3=θ,x4=,将机械臂系统(92)转化为如下一阶系统的形式,如式(94)所示,再对其设计自适应动态面控制器.

情况 2.增加更为复杂的约束边界进行仿真对比,期望的跟踪信号为yd=cos(2t)+sin(0.5t),约束边界为F1=1.01×2-2t+1-cos(2t)-sin(0.5t),F2=0.56×2-1.2t+0.84+cos(2t)+sin(0.5t),系统初值设置为x1(0)=2,x2(0)=1,x3(0)=x4(0)=0.5.其他相关参数及记法与情况1 一致,得到系统输出仿真结果如图2 所示.

由图1 和图2 可知,系统本身存在输出约束,但是自适应动态面控制器不考虑输出约束问题,就无法始终保持系统输出在约束范围内.从仿真结果来看其中存在系统输出超出约束边界的情形,这对于实际工程比如无人车系统、隧道无人机系统等,超出约束边界就意味着无人车冲出跑道、无人机撞到隧道边界,出现事故.而本文算法能够有效使系统输出始终保持在约束范围内,不违反约束条件.

图2 情况2 下的系统输出跟踪结果Fig.2 System output tracking results in Case 2

为说明本文算法的先进性,将本文算法与基于非对称障碍Lyapunov 函数(BLF),即参考文献[5]中的方法以及传统基于非线性映射函数(Nonlinear mapping,NM),即参考文献[8-9]中的方法,在情况1 和情况2 两种情况下进行对比仿真,相关参数和初值保持不变.将对比的两种方法简称为一阶BLF 方法和一阶NM 方法.将本文方法仿真结果记为x1,h,eh,(h),(h),uh;将一阶BLF 方法仿真结果记为x1,f1,ef1,(f1),(f1),uf1;将一阶NM 方法仿真结果记为x1,f2,ef2,(f2),(f2),uf2.情况1 的仿真结果如图3~7 所示;情况2 的仿真结果如图8~12 所示.

图3 系统输出跟踪结果(情况1)Fig.3 System output tracking results (Case 1)

上述仿真结果中,图3、图8 和图4、图9 分别为系统输出跟踪结果和跟踪误差,可知三种控制方法下的系统输出均能有效地跟踪期望信号,且系统输出不违反约束条件,始终保持在约束范围内;相比于一阶BLF 方法和一阶NM 方法,在相同的控制参数及相同的初值条件下,本文方法收敛速度和精度都略优.图5、图6 和图10、图11 为系统参数估计结果,可知三种控制方法下的参数估计值均能有效收敛到参数真实值附近,且本文方法收敛精度和收敛速度更好.图7 和图12 为系统控制输入,可知三种控制方法的输入均在合理范围内,相比于一阶BLF 方法和一阶NM 方法,本文方法控制输入初值更小.

图4 系统跟踪误差(情况1)Fig.4 System tracking errors (Case 1)

图6 参数估计(h),(f1),(f2) (情况1)Fig.6 Parameter estimation (h),(f1),and (f2) (Case 1)

图7 系统控制输入(情况1)Fig.7 System control inputs (Case 1)

图8 系统输出跟踪结果(情况2)Fig.8 System output tracking results (Case 2)

图9 系统跟踪误差(情况2)Fig.9 System tracking errors (Case 2)

图10 参数估计(h),(f1),(f2) (情况2)Fig.10 Parameter estimation (h),(f1),and (f2) (Case 2)

图11 参数估计 (h),(f1),(f2) (情况2)Fig.11 Parameter estimation (h),(f1),and (f2) (Case 2)

图12 系统控制输入(情况2)Fig.12 System control inputs (Case 2)

注 4.对于反步法/动态面控制方法而言,随着系统阶数的增多,控制器设计步骤也会增多,不仅会增加控制器设计的复杂度、引起微分爆炸问题,还会增加中间步骤的误差.而本文方法直接对高阶系统设计控制器,不仅省去了将高阶系统转换为一阶系统这一步骤,还能减少控制器设计步骤,从而有效减弱上述问题.

为进一步说明本文方法的优势,将本文方法与上述一阶BLF 方法以及一阶NM 方法在相同的仿真参数下,并在同一台计算机同一个仿真软件下运行50 次,比较三者在情况1 和情况2 两种情况下的运行时间,结果如表1 所示.可知相比于一阶NM 方法和一阶BLF 方法,由于本文方法设计步骤更少,所需仿真时间更少,具有更高的效率.

表1 三种算法运算时间对比(s)Table 1 Comparison of operation time of three algorithms (s)

由上述仿真结果可知,本文所提出的算法不需要将原始系统转化为4 个一阶子系统,设计步骤更少,能使系统始终满足输出约束要求.相比于一阶系统方法,本文方法在收敛精度、收敛速度方面略优,控制输入初值更小、仿真时间更少.

注 5.一阶BLF 方法、一阶NM 方法以及本文方法均能有效处理输出约束问题,对应的文献从理论方面说明了三种方法能确保闭环系统所有信号一致最终有界,输出约束能始终满足,而且本文的仿真也证实了三种方法都能有效处理输出约束问题.从仿真结果来看,本文方法的收敛精度、收敛速度略优于一阶BLF 方法和一阶NM 方法,性能指标方面并没有很突出的优势.这是因为本文的优势主要在于能减少设计步骤、降低算法设计复杂度,从而减弱反步法/动态面控制方法的微分爆炸问题,这对于反步法/动态面控制是很有意义的.从仿真结果中也能证实本文方法控制输入初值更小、算法运算时间更少,具有更高的效率.

5 结束语

针对不确定高阶严反馈系统,基于全驱系统方法,本文提出一种高阶自适应动态面时变输出约束控制方法.首先通过非线性转换函数将原输出约束系统转换为无约束的系统,进而可通过确保新系统的有界性使得原系统输出约束得到满足.然后基于全驱系统方法,在高阶动态面控制方法的框架下直接对每个高阶子系统设计控制器,而不需要将其转化为一阶系统形式,减少了一些步骤;通过引入一系列低通滤波器来获得虚拟控制律的高阶导数,进而将复杂的高阶求导运算转化为简单的代数运算,更加简洁高效.通过Lyapunov 稳定性理论证明闭环系统所有信号都是一致最终有界的,系统输出约束条件始终得到满足,且可通过调整参数使得系统跟踪误差收敛到原点的任意小邻域内.最后通过对实际的机械臂系统进行仿真,验证了本文所提控制方法的有效性.

猜你喜欢
反馈系统有界时变
复Banach空间的单位球上Bloch-型空间之间的有界的加权复合算子
一类具低阶项和退化强制的椭圆方程的有界弱解
基于ZigBee技术的交互式智能教学反馈系统设计
基于时变Copula的股票市场相关性分析
基于时变Copula的股票市场相关性分析
浅谈正项有界周期数列的一些性质
烟气轮机复合故障时变退化特征提取
一种用于生物刺激反馈系统的新型刺激电流源
基于MEP法的在役桥梁时变可靠度研究
基于WiFi-SMS的互动反馈系统的设计与应用