事件触发策略下多AUV抗干扰固定时间编队控制

2021-07-31 12:42王洪斌
控制理论与应用 2021年7期
关键词:领航观测器扰动

苏 博,王洪斌,高 静

(1.燕山大学电气工程学院,河北秦皇岛 066004;2.燕山大学工业计算机控制工程河北省重点实验室,河北秦皇岛 066004)

1 引言

海洋资源的开发及利用是各国完备战略资源的重要手段,自主水下机器人(autonomous underwater vehicle,AUV)作为一种海洋探索的辅助智能工具,在资源勘探、海洋环境监测、军事侦察、海洋防卫等领域发挥着重要的作用[1–3].AUV作业环境复杂、作业范围不断拓展,需要多AUV协同作业,提升水下作业的高质化、高效化,因此对多AUV一致性和编队控制提出了更高要求[4].虚拟领航者–跟随者编队方法,因其具有控制简单、队形结构实现难度低等优点,成为编队控制中应用最广泛的策略之一[5].

以往的领航–跟随多AUV系统是在连续通信策略下实现控制,领航AUV需要连续不断的将自身状态信息传输给跟随AUV.然而,多AUV间进行连续性信息传输,不仅会导致网络拥塞,增加通讯负担,还会造成不必要的信息传输,耗费通信资源.事件触发机制通过抑制控制器的更新次数,减少个体之间信息传输的频率,节约控制器传输网络资源.文献[6]针对具有外部干扰的线性多智能体系统,提出一种分布式事件触发一致性协议,有效的减轻整个通信网络的通信负担.随后,针对一类相互关联的随机非线性系统,基于事件触发的动态输出反馈自适应模糊分散控制问题得到研究[7].文献[8]讨论了一个欧拉–拉格朗日多智能体系统的编队控制与跟踪问题,采用事件触发机制减少智能体之间的通信数量,从而减少能耗.文献[9]针对不确定性非线性系统,提出了固定时间和事件触发相结合的控制策略,解决了智能体一致性控制问题,但是被控对象为一阶系统.文献[10]针对单输入单输出系统的跟踪控制问题,提出了基于事件触发策略的固定时间控制方案.文献[11]研究了基于事件触发机制的水下机器人固定时间编队控制问题,但并未考虑外界扰动对系统稳定性能的影响.

AUV系统模型具有强非线性、耦合性、复杂性等非线性动力学问题,模型参数摄动及外界复杂作业环境并存,这些不确定因素会严重影响多AUV编队系统的动态性能.文献[12–13]针对自主水面船舶编队控制提出了自适应神经网络技术处理系统外界扰动,保证系统信号一致最终有界.文献[14]提出了模糊自适应技术处理系统外界扰动.众所周知,扰动观测器是一种重建外部不确定信息的关键技术.文献[15]提出了有界稳定观测器的设计方案.为了得到更快的收敛速度及抗干扰能力,文献[16]针对系统存在的参数摄动和外界扰动,提出了有限时间稳定观测器,实时估计复合扰动,从而保证控制系统的有限时间稳定收敛.虽然基于有限时间的观测器可对扰动精确估计,但其收敛时间严重依赖于初始观测误差,限制了应用的可行性.

实现多AUV编队快速收敛是控制系统的重要性能指标.以往多数AUV编队控制是渐近稳定的[17],或者是有限时间稳定的[18–19],则系统的收敛时间随着初值的变大而无限增长,大大削弱了系统的收敛性能.同时,实际工程中状态信息初始值很难获知.固定时间控制理论[20]是基于有限时间算法提出的,不仅具备提高系统收敛速度,且收敛时间仅取决于控制器的设计参数,克服了对系统初始状态的依赖.对于收敛时间严格的系统,基于固定时间理论设计控制器更符合实际应用的需求.近年来,固定时间理论先后在多智能体一致性[21]、电力系统[22]、遥操作机械臂[23]等领域取得了一定研究成果.以上研究为解决多AUV编队控制快速收敛提供了理论支撑.

综上,本文针对多AUV编队控制过程中,存在的模型参数摄动、外界洋流干扰、网络资源耗费等问题,提出一种基于固定时间模糊扰动观测器和事件触发策略相融合的控制算法.主要创新工作如下:

1) 设定AUV模型参数不确定性和外界扰动为集总扰动,基于固定时间理论和模糊自适应算法,构造了固定时间收敛的自适应模糊扰动观测器,实现对集总扰动的精确估计.所设计的观测器是实际固定时间稳定的,且收敛时间最大值取决于控制器设计参数,与系统状态初始值无关,提高了观测器收敛速度.

2) 基于扰动观测器、反步法、指令滤波技术、固定时间理论及虚拟领航轨迹概念,将分布式事件触发机制应用到多AUV编队控制研究中,构造事件触发函数,提出了事件触发编队控制策略,减少了系统传输网络的通信能耗,确保整个闭环系统是固定时间稳定的;同时通过理论证明,事件触发控制过程中无Zeno行为,保证控制器设计的合理性.最后通过对多AUV系统进行仿真实验,验证了算法的可行性.

2 问题描述

2.1 系统模型与假设

由虚拟领航跟随结构组成的AUV队列,见图1所示.图1每个跟随AUV相对位置和姿态信息已知.假设所有AUV都有固定的姿态,则AUV的水平面运动学及动力学模型[5]为:

图1 领航–跟随多AUV编队示意图Fig.1 The diagram of leader-follower formation of multi-AUVs

其中:η=[x y ψ]T和υ=[u v r]T为全局坐标系中的位置和线性速度,且ψ为艏向角;系统控制输入为τ=[τuτvτr]T;τw=[τwuτwvτwr]T为外界海流扰动.M和D(υ)分别表示惯性矩阵和阻尼矩阵.其形式如下:

其 中:mu=m −Xu˙,mv=m −Yv˙,mr=Iz−Nr˙,m>0为AUV质量.Xu˙,Yv˙,Nr˙为附加质量,Iz是转动惯量.

其中:D(υ)∈R3×3为非线性阻尼矩阵,元素du=−(Xu+Xu|u|u),dv=−(Yv+Yv|v||v|),dr=−(Nr+Nr|r||r|).R(ψ)∈R3×3为旋转矩阵,满足等式R(ψ)RT(ψ)=I3×3.

其中C(υ)∈R3×3为科里奥利和向心力矩阵.由于AUV 模型的参数容易受到自身特性、工作条件、外部环境变化等因素的影响,因此可以将AUV模型的参数改写为含有不确定项形式:M=M0+∆M,C=C0+∆C,D=D0+∆D.M0,C0,D0均为标称矩阵,∆M,∆C,∆D为参数不确定性,式(2)重新整理如下:

其中由参数不确定项和外界海流扰动组成的集总扰动表示如下:

2.2 虚拟领航跟随方法

基于虚拟领航控制方法,引入虚拟轨迹概念,将编队控制问题转化为轨迹跟踪问题[17,26].虚拟轨迹由领航AUV期望的编队构型形成.横向距离dx=,纵向距离.虚拟领航者代表期望的参考位置,代替真实领航者作为跟随者的参考,当跟随者到达虚拟领航者的位置时,意味着编队处于期望的运动状态,此时跟随者和领航者之间保持着预定的距离和角度.

在惯性坐标系下,虚拟轨迹描述为如下形式:

方程(8)简写如下:

其中:L=[dxdy0]T,ηl=[xlylψl]T代表领航位置坐标,ηv=[xvyvψv]T表示虚拟领航者位置.

2.3 引理与假设

引理1[20]若V:Rn →R+∪{0}是连续的径向有界函数:

1)V(x)=0⇔x=0,

2) 若任意的x(t)满足不等式

则系统是全局固定时间稳定的,式中:γ1,γ2,α,β均是正常数,0<α<1,β >1.其收敛时间T有界且独立于系统的初始值,满足不等式

3) 若任意的x(t)满足不等式

则该系统是实际固定时间稳定的,且存在正常数γ1,γ2,α,β和θ,0<α<1,β >1,0<θ <1.使得收敛时间T满足

假设1领航AUV的状态可用.

假设2领航AUV的轨迹是有界的且导数存在,其一阶导数和二阶导数均存在且有界.

控制目标:对于模型(1)和(7)组成的AUV系统,设计固定时间自适应模糊干扰观测器实时观测外界集总扰动,基于反步法、指令滤波器、固定时间控制理论和分布式事件触发机制为跟随AUV设计编队控制律,使跟随AUV实现对虚拟领航AUV的轨迹跟踪,进而完成编队控制,所提出的控制方法降低网络能耗的同时,保证所有闭环信号达到实际固定时间稳定,即

其中:T ∈[0,∞)为系统收敛时间,用下标v,f来区分虚拟领航AUV和跟随AUV.

3 控制器设计

首先设计固定时间自适应模糊干扰观测器,估计系统集总扰动;然后基于观测器,固定时间理论,事件触发策略,设计分布式编队控制器.基于事件触发机制的编队控制器用来降低网络传输负担,系统的采样时刻只发生在事件触发条件函数为真时,因此可以通过判断事件触发条件有效较少控制器触发次数,从而节约有限的网络资源.

3.1 固定时间自适应模糊干扰观测器的设计

结合固定时间理论与模糊控制设计自适应固定时间模糊干扰观测器,实现对系统复合扰动的观测估计.含一元模糊化、乘积推理、加权平均反模糊化以及隶属度函数为高斯函数的模糊系统表达式如下:

式中:ω为模糊系统的输入向量;λ0=[y1y2···yi]T为可调参数向量;ξ0(ω)=[ξ1(ω)ξ2(ω)···ξi(ω)]T为模糊基函数向量,ξ0(ω)的第j项定义如下形式:

文中观测器设计不考虑此情况.

3.2 事件触发编队控制器的设计

用t0,t1,···,tk来表示事件触发时间序列,其中tk表示跟随AUV的触发时间.基于固定时间模糊干扰观测器的事件触发控制律设计如下:

式中:01,kj >0(j=3,4,5).触发规则为tk+1=inf{t>tk:f(t)≥0;k ∈N},t0=0,f(t)为事件触发函数,当tk到达时,f(tk)≥0,事件触发控制器(33)被触发进行更新.在两次触发时刻之间,控制器保持上一时刻值不变.

定义事件触发测量误差为

构造事件触发编队控制器的设计过程分两步.

步骤1定义跟随AUV位置跟踪误差为

根据式(1)和式(9),对z1(t)求导得

其中:变换矩阵R(ψ)−1=R(ψ)T,R˙(ψ)=R(ψ)S(rl).其中rl为领导者的艏遥角速度,

选择运动学控制器

其中kj >0,j=1,2.为了避免反复求导带来的微分爆炸问题,引入指令滤波器,定义αvf=[αvfuαvfvαvfr]T作为其输入,得到新变量和,其表达式为

其中:φ1和ι1是滤波器输出信号,且参数满足µ>0和ς ∈(0,1],分别表示滤波器的固有频率和阻尼比,且选取φ1(0)=αvfi(0),ι1(0)=0.

定理2考虑被控对象(1)和(7)组成的AUV系统,将事件触发机制引入多AUV编队控制策略中,结合固定时间自适应模糊干扰观测器,设计出基于事件触发的控制器(33),将触发条件函数选取为下式:

式(47)中,当f(t)≥0时,事件被触发的同时进行控制器更新,测量误差将收敛到零.当f(t)<0时,则多AUV编队系统满足实际固定时间稳定,收敛时间存在最大上界Tz,表达式后续给出.

证为了保证多AUVs编队控制系统闭环稳定性,构造正定Lyapunov函数

将干扰观测器引入到事件触发控制中,根据定理1和不等式放缩原理可得

事件触发条件函数选取见式(47).当f(t)≥0时,此时事件触发控制器进行更新,直到测量误差为零;当f(t)<0时,控制器不再进行更新触发,由引理1可知,式(52)是实际固定时间收敛.式(52)简写为如下形式:

其中0<θ <1.综上所述,基于固定时间干扰观测器和事件触发机制的分布式编队控制算法总收敛时间满足Tz≤T1+T2.

3.3 可行性分析

事件触发通讯策略若存在Zeno行为会使其控制器被无限次触发,导致能源进一步耗费从而使得控制策略间接失效,因此关键问题是排除Zeno行为.通过证明任意两次触发间隔{tk+1−tk,k ∈N}存在一个正下界,即可说明事件触发过程无Zeno行为.由e0(t)=τf(tk)−τf(t),t ∈[tk,tk+1),并且根据式(34)和引理2得

4 仿真研究

对由3艘AUV组成的系统进行编队控制的仿真研究,其中AUV0和AUV1,AUV2代表1个虚拟领航者和2个跟随者.多AUV系统模型参数选取见表1.领航AUV的轨迹描述如下:

表1 AUV的模型参数Table 1 Model parameters of AUV

期望编队队形参数选取如下:

为了验证算法收敛时间不依赖于系统初态,AUV1和AUV2给定不同的初始状态,具体取值见表2.干扰观测器

表2 AUVs的任意初始状态Table 2 The times of event-triggered for follower AUVs

控制器参数

系统模型参数摄动选取为标称值20%,外界海流扰动描述如下:

工况1:依据本文所提算法及上述参数对跟随AUV不同初始状态(详见表2数据)进行仿真,仿真结果如图2–10所示.图2为位置跟踪误差z1(t),z1(t)很好的收敛到原点附近.图3为速度误差z2(t).图4–5分别为跟随AUVs的运动学控制器αvf和动力学控制器τf(tk).

图2 位置跟踪误差Fig.2 The position tracking error

图3 速度跟踪误差Fig.3 The velocity tracking error

图4 虚拟控制律Fig.4 The virtual control law

图6给出干扰观测器的仿真结果,图中跟随AUV的初始值选取不同,但从其收敛时间一致的情况可以看出,干扰观测器是固定时间稳定的.图7给出10 s内跟随AUV的事件触发时刻示意图,随着系统的稳定,控制器触发间隔越来越大,触发时刻变得稀疏,这与预期的结果一致.同时,从仿真图可以观察到数据传输是非周期的.此外,存在很多时刻事件没有被触发,此时并不需要无线网络进行数据传输,从而节约了网络传输能耗,降低网络拥塞.图8给出跟随AUV1和跟随AUV2取相同角度平面轨迹示意图,图8跟随AUV的起始点和表2数据初始状态吻合,表明在不同的初始状态下,系统收敛的时刻不受影响.

图5 控制输入Fig.5 The control input

图6 干扰及估计Fig.6 Disturbance and its estimation

图7 事件触发时刻Fig.7 The event-triggered interval

图8 平面轨迹图Fig.8 The trajectory of plane(refer to same perspectives of virtual leader)

图9 平面轨迹图(参考虚拟领航者角度不同)Fig.9 The trajectory of plane(refer to different perspectives of virtual leader)

图10 跟随AUV1的控制输入Fig.10 The control input of AUV1

图11 跟随AUV1的事件触发间隔Fig.11 Triggering instants for the follower AUV1

工况2:为了更直观的说明干扰观测器的有效性,仅考虑外界海洋干扰.图12给出了扰动及其估计仿真结果,图中di(i=1,2,3)代表系统所受的外界扰动,和分别代表跟随者AUV1和AUV2估计值(初始状态不同).由图可见干扰估计值快速收敛到实际值曲线上,准确的估计出集总扰动,从而能够实时的补偿外部扰动对编队系统的影响.

图12 干扰及估计Fig.12 Disturbance and its estimate

表3数据为跟随AUV1和AUV2的总触发次数统计结果,表明编队控制过程中没有发生Zeno行为.由此可知,本文将事件触发通讯机制引入到多AUV编队系统中是有效的,同时和以往连续通讯机制相比,在有限传输网络带宽条件下,减少了信息通讯次数从而进一步降低通信能耗,节省了网络资源.

表3 跟随者AUVs的事件触发次数Table 3 The times of event-triggered for follower AUVs

工况3:针对AUV2给出的初始状态,仅考虑系统外界海洋干扰,将本文所提出的固定时间事件触发控制器与有限时间反步方法和渐近稳定反步算法进行比较,仿真结果见图13–15所示.图13–14给出了3种算法下的误差图,从图中可以看出固定时间具有较快的收敛速度,有限时间收敛时间受系统初始值影响,初始值选取不适合时,会导致收敛时间加长.

图13 跟随者AUV2的位置跟踪误差Fig.13 The position tracking error of follower AUV2

图14 跟随者AUV2的速度跟踪误差Fig.14 The velocity tracking error of follower AUV2

有限时间反步控制律设计如下:

其中:参数k3=diag{3,3,3},k5=diag{5,5,5},a2=0.7.

渐近稳定反步控制律设计如下:

其中:k3=diag{1,1,1},k5=diag{5,5,5}.

图15分别给出了3种控制算法下轨迹平面图,虚拟AUV设定的参考角度依次是5π/4,3π/4,7π/4.从仿真结果可见,3种控制算法的起始点一致,在固定时间控制器作用下跟随AUV1可以较快的跟踪上虚拟轨迹,每个跟随AUV都和领航者保持一定的距离和角度,进而完成编队控制.

图15 3种控制算法下跟随AUV2轨迹Fig.15 Trajectory of follower 2 under three methods

5 结论

针对多AUV分布式编队控制问题,本文提出了基于固定时间自适应模糊干扰观测器的事件触发控制策略,解决了多AUV编队系统节约传输网络通信资源及提高编队收敛速率的问题.设计了固定时间自适应模糊干扰观测器,用来实时逼近系统集总扰动,保证系统观测误差实际固定时间收敛;提出了基于事件触发策略的编队控制策略,实现编队系统固定时间稳定.所提出的控制方法加快了系统的收敛速度,其收敛时间不受系统初值影响,克服了实际工程中不易精确获得系统初态的难题;同时引入事件触发策略,减少了控制器传输网络中的信息传输能耗,进而提高了有限通信资源的利用率,延长网络寿命.

猜你喜欢
领航观测器扰动
一类五次哈密顿系统在四次扰动下的极限环分支(英文)
基于增强型去噪自编码器与随机森林的电力系统扰动分类方法
扰动作用下类岩石三轴蠕变变形特性试验研究
领航
带扰动块的细长旋成体背部绕流数值模拟
领航
基于滑模观测器的PMSM无位置传感器控制策略
基于非线性干扰观测器的航天器相对姿轨耦合控制
领航海外
领航海外