领导者输入未知的多智能体系统容错一致性设计方法

2022-05-18 02:12缪坤忠李建宁

无人系统技术 2022年2期

缪坤忠，李建宁

（杭州电子科技大学自动化学院，杭州 310000）

1 引言

近年来，由于多智能体系统在飞行器编队[1-2]、传感器网络系统[3]、卫星编队等领域[4]得到了广阔的应用，多智能体系统研究备受关注。特别是领导—跟随多智能体的一致性问题，即所有智能体的状态都可以通过适当的控制器达到一致，使领导者和跟随者之间的距离最小化。同时，许多学者提出一个领导者或者多个领导者[5-6]、固定时间[7-8]、自适应一致性[9-10]等领域的相关研究成果。

多智能体系统容易因未知现象而突然发生故障，这将导致控制性能的下降，为了克服这个困难，最值得考虑的办法是自适应控制算法[11-12]、鲁棒控制[13-14]等。其中，自适应控制最为突出，它被应用在许多领域。例如，在文献[15]中，所研究系统的执行器故障模型由线性部分和非线性部分组成，比文献[11-12]中考虑的故障模型更为一般。此外，利用自适应控制策略得到的信息对控制器进行重构，使得Takagi-Sugeno 模糊系统的稳定性受到较大的影响。文献[16]描述了一种基于观测器的辅助变量，利用自适应律来估计扰动和部分失效系数，传统一致性控制协议和鲁棒控制的结合，实现了智能体的约束一致性。在文献[17]中，考虑了故障的特征，建立分布式故障模型，并采用H∞模糊控制器来保证双边遥操作系统的正常运行。但是上述文献在处理故障时，根据考虑故障的特征（微小故障的系统比大故障的系统发生故障的概率要大），建立一个更符合实际情况的失效模型十分有必要，同时这也是本文的第一个出发点。

另外，随着多智能体应用领域的复杂化，繁琐的系统规模以及控制精度的增加，不可避免地导致系统的稳定性降低，例如网络攻击使得智能体之间的信息交互通信延迟、系统元器件损坏、系统的结构可能发生跳变等，大大影响了系统的安全性。为了解决这些问题，学者们也做了许多努力。例如，在文献[18]中，网络攻击强度的概率提前未知，一种强度依赖的共识协议被提出，DOS 攻击下的异构系统可以更快达到收敛目标。在文献[19]中，通过设计一种新颖的模糊模型去描述异构问题和控制器，非线性的多智能体系统在时变的拓扑切换下可以快速达到稳定。在系统的通信拓扑发生故障和领导输入受限的情况下，文献[20]将高速列车模型转化为协调一致问题，建模成带有领导者的模型更为恰当，并采用Lyapunov-Krasovskii 方法提出H∞控制器增益。以上所讨论文献的不足之处是领导者和跟随者初始状态都要求是相同的，这在实际中应用的范围是有限的。在领导输入未知的情况下，文献[21]提出了自适应容错控制协议，该协议与智能体之间的信息交换无关，可以减弱领导者输入未知的影响。在文献[22]中，领导的输入假设为有界，基于固定耦合增益和自适应时变增益的鲁棒控制器被提出，该控制器在保证系统正常工作的同时，也消除了外部干扰的误差。但是大多数文献在处理领导者输入未知时，假设领导者的输入有界，这在特殊实际应用中存在一定的局限性。因此，本文构造了一个基于初始状态的性能指标来绕过零初始条件的需要，并结合鲁棒技术和自适应方法来解决领导者输入绝对未知的问题，即本文的第二个出发点。

本文解决了执行器故障和领导者输入绝对未知的问题，本文的主要贡献总结如下。

（1）首先，基于故障的特征（微小故障发生的概率大于严重故障发生的概率，以及微小故障发生后的系统比健康系统更容易发生故障），建立了适合系统的故障分布模型。

（2）在传统的经典H∞控制理论中，由于零初始条件的约束，每个智能体（包括领导者和跟随者）的初始状态要求是相同的，保守性较强，因此本文构建一种性能指标来减少零初始条件对系统的影响。

（3）结合鲁棒技术和自适应方案，一种新颖的容错控制器被呈现来削弱领导者绝对未知和执行器故障对系统的影响。

2 物理模型

2.1 图论

包含N个智能体的通信拓扑用加权图G(V,ε,A) 来表示，V={v1,v2,…,vn}是节点集，用ε⊆V×V来表示边集，A=[aij]∈RN×N对应通信拓扑结构图的邻接矩阵。如果智能体i向智能体j发送信息，则说明智能体i和智能体j是邻居关系，两个智能体之间的权重记为aij，反之如果智能体i和j之间没有边，则aij= 0和(Vi, Vj)∉ε。如果对于任意的智能体i和j都满足(Vi, Vj) ∈ε, (Vj, Vi)∈ε，则说明图G为无向图，反之为有向图。拉普拉斯矩阵L=[lij]∈RN×N满足如下特征：lii=∑i≠j aij,lij=-ai j,i≠j。有向图的拉普拉斯矩阵是对称的，无向图的拉普拉斯矩阵一般是非对称的。在本文中，考虑了带有领导者的多智能体系统，领导者和跟随者之间的通信结构用对角矩阵G=diag{g1,… ,gN}来表示，其中如果智能体i= 1,… ,N和领导者i= 0之间有信息交流，则gi＞ 0；否则，gi= 0。

2.2 系统模型

本文考虑了一类具有故障和领导者输入绝对未知的领导–跟随多智能体系统，领导者的动力学方程被确定为：

其中，x0(t)∈Rn为系统领导者的状态量，r0(t)∈Rs是代设计的系统领导者绝对未知输入，A∈Rn×n,B∈Rn×s被假定为已知且具有恰当维数的实矩阵。

与(1)相似，第i个跟随者动力学模型被定义为：

本工作的目的是设计一系列合适的控制器uiF(t)，在故障和未知领导者输入的情况下实现领导—跟随一致性。

2.3 执行器故障建模

目前，部分执行器被提出的失效模型是基于故障的结构特征，例如，微小故障的发生概率大于重大故障的发生概率，与运行良好的系统相比，有故障的系统更容易发生故障。因此，分布式故障模型需要被提供，如图1所示。

图1 分布式故障模型Fig.1 Failure distribution model

数字1、2、3分别被用来代表健康系统、小故障系统、重大故障系统，π12被定义为健康系统向微小故障系统过渡的跳跃概率，其他信息可以类比。

接下来，将详细地介绍故障的马尔科夫跳变过程。使用随机变量{ri(t)}去描述具有右连续的马尔科夫过程，它的范围在预定的范围内F={1,2,3, …,f}。此外，马尔科夫链相关的模态转移的跳变概率被描述为：

注 1.模态信息{ri j(t)}扩维后的信息用{ri j(t)}来表示，其中ri(t) ∈{3smodes} 。

为了解决故障和输入的安全性问题，在模态ri(t)下的智能体i模型的输入信息被建模成如下的形式：

其中，ρi(ri(t))代表智能体i的执行器在模态ri(t)下的故障失效系数，且满足

此外，由于实际的情况，可以得到：

其中，ρij(ri j(t))定义为在模态ri j(t)下，第ith智能体的第jth执行器的失效系数。如果ρij(ri j(t)) = 1，在模态ri j(t)下第ith智能体的第jth执行器没有故障；如果0＜ρi j(ri j(t)) ＜ 1，在模态ri j(t)下第ith智能体的第jth执行器部分失效故障；如果ρi j(ri j(t)) = 0，在模态ri j(t)下第ith智能体的第jth执行器完全失效。

注2.在任意(s-j)个执行器失效的情况下(1≤j≤s-1)，其余的执行器仍能正常地工作来实现所需要的控制目标。

对于执行器的故障模型，若由(1)和(2)组成的系统模型可以得到容错一致性，需要做以下合理假设。

假设 1[23]: 系统模型的系数矩阵(A,B)是可控的。

引理1[24]: (Schur 补引理)。对于给定的对称矩阵，其中S11为r阶方阵，以下3 个条件是等价的：

2.4 领导—跟随一致性协议

受文献[25]的启发，和领导—跟随多智能体的状态信息，如果对于任意的初始条件x0(0)和xi(0),i=1,2,…,N满足：

则由式(1)和(2)组成的领导—跟随多智能体系统在执行器故障的情况下可以实现容错一致性。

根据相邻智能体的相对状态信息，构建如下分布式容错控制协议：

其中：

基于上述的分析，将式(3)和(6)带入式(2)中，可以得到xi(t)的动力学方程：

通过定义误差向量δi(t)=xi(t)-x0(t)，则相应的闭环系统的状态方程为：

以及闭环系统的增广形式被描述如下的形式：

其中：

注 3.结合标注1，每一个智能体的模态总数为3s，模态信息ri(t)扩维后的模态基数是(t) ∈{3Nsmodes}。

考虑变量β((t))和ρ((t))之间的关系，δ˙(t)的动力学方程可以改写为：

3 主要结果

在本文中，一种时变容错辅助控制函数被提出来补偿执行器故障和未知的领导输入，然后通过Lyapunov 稳定性定理得到两个未知估计值的自适应更新律。最后，在设计控制器的过程中，引出基于初始状态的性能指标，解决了初始状态相同的问题并得到系统稳定的充分条件。

3.1 分布式自适应控制

本文所设计的时变辅助控制函数Ki2(t)为：

此外，在给出领导输入和执行器故障的估计值之前，如下的定义是需要的：

令B=[b1,b2,...,bs]和bj是B的jth列向量，然后做出如下合理的定义：

根据投影算子，时变参数(t)(j=1,2,...,s)的自适应律确定为：

其中，σi是一系列恰当的参数，满足σi＞0,i=1,2,… ,N。

3.2 容错控制

在本文中，为系统设计了恰当的容错控制器。为简化公式，将模态信息ri j(t)，(t)和ri(t)分别表示为aij，a和ai。

定理 1.在假设1 和一致性协议(6)的基础下。给定恰当的参数ς1＞0,ς2＞ 0，γ＞ 0，拓扑结构矩阵L,G，具有恰当维数的系统矩阵A和B，设计适合于系统的容错控制器增益矩阵为K(a)=-BTP(a)，如果存在合适维度的矩阵(b) ＞0，(a) ＞0，P(a) ＞0，＞0，M2＞0和M3＞0，满足式(14)和式(15)的线性矩阵不等式成立，则由式(1)和式(2)组成的系统可以实现具有H∞性能指标γ的领导—跟随容错一致性。

其中：

证.构造李雅普诺夫函数候选者为：

注 4.结合所选拓扑及其对应的邻接矩阵，以及领导者和跟随者之间的邻接矩阵，可以保证(L+G)T是正定的，满足Lyapunov 函数(16)的正定性。

设 ℘(·) 为随机过程{(δ(t),a),t≥0}的弱无穷小微分算子，可以得到：

用(L+G)T⊗P(b)表示为(b)，将式(10)代入式(17)，由式(17)可得：

将式(19)带入式(18)可以导出式(20)。

由自适应更新律式(12)和式(13)可得等式：

此外，在模态ai下βi(ai)的实际值在[0,1]之间，可得：

然后可以得到如下的结果：

受相关文献[16]启发，在经典的H∞控制理论中，由于初始条件为零的要求，即δ(0) =0表示必须满足x1(0)=x2(0) =...=xN(0)=x0(0)，但在实践中，这是相当保守的。因此，在控制器的设计过程中，建立了由误差信息和初始状态组成的性能指标函数，以降低零初始条件对系统的影响。

所设计的性能指标J表示为:

其中：

进一步推展有：

如果正定矩阵M1,M2,M3满足，γ2M2- I ＞0，γ2M3- I ＞0和=(a)M1，可以得到ζ＞ 0。在上述条件下，若ϑ＜ 0，则必然可以得到J＜ 0。

将式(24)带入ϑ，不难得到：

其中，ψ(t) =(δT(t),ηT(t),QT(t))T以及

如果线性矩阵不等式(14)和(15)成立，我们可以得出ϑ＜0 ，式(25)中规定的性能指标可以实现。整个系统(10)可以在执行器故障和干扰的情况下保持稳定。也就是说，所考虑的领导—跟随多智能体系统能够实现容错一致性，从而完成定理1 的证明。

4 数字仿真

在本节中，用一个仿真的例子来说明所提供的理论方法的有效性。图2描述了由5 个智能体组成的通信拓扑结构。

图2 通信拓扑结构图（智能体0 是领导者）Fig.2 Network topology(agent 0 is the leader)

相应的，拉普拉斯矩阵L和领导者的邻接矩阵G为：

考虑一类具有执行器失效的线性领导—跟随多智能体系统，每个智能体的参数描述如下：

给出领导者和跟随者的初始状态以及领导者的输入：

选择参数γ=0.5、ς1=0.6和σi=1,i=1,2,...,N，自适应律的初始条件为： [(0),(0)] =[8,3.15]。

根据故障的特点和实际情况，大多数智能体处于微小故障，即执行器故障数值范围在模态2内。由此假设每一个跟随者在故障切换下的转移矩阵如下：

根据故障对系统性能的危害程度将其分为几个等级，并假设每一等级的数值范围如下：

选择辅助的失效系数为：0≤β1s(t) ≤0.078，0≤β2s(t) ≤0.275，0≤β3s(t) ≤0.46，0≤β4s(t)≤0.165。

通过求解（Linear Matrix Inequality, LMI）(14)和(15)可以得到如下矩阵P(a)，a=1,2,3，则相应的控制器增益K(a)=-BTP(a),a=1,2,3为：

在本文中，假设领导者输入和执行器故障是未知的。从图3可以看出，在控制器作用下，领导者输入的估计值可收敛到实际领导者的输入。图4～7，表示故障的模态切换信息和故障估计的仿真结果，可以有效地估计故障。另外，图8显示所有智能体的跟踪轨迹，表明跟随者智能体的状态最终趋近于领导者智能体的状态。上述结果表明，该算法能较好地估计故障和实现容错一致性。

图3 参数 r0(t)和(t)的轨迹Fig.3 Trajectories of parameters r0(t)and(t)

图4 智能体1 的故障模态和失效系数估计值Fig.4 Failure mode and coefficient estimation of Agent 1

图5 智能体2 的故障模态和失效系数估计值Fig.5 Failure mode and coefficient estimation of Agent 2

图6 智能体3 的故障模态和失效系数估计值Fig.6 Failure mode and coefficient estimation of Agent 3

图7 智能体4 的故障模态和失效系数估计值Fig.7 Failure mode and coefficient estimation of Agent 4

图8 智能体（包括领导者和跟随者）运动轨迹Fig.8 Trajectory of agents (including leader and followers)

注5.在设计控制器增益的过程中，引入性能指标J，考虑了领导者输入未知、故障对估计误差的影响，如式(25)，扰动量ς2βi(a)r0(s)]包含领导者输入的估计误差，可起到抑制作用，使系统有更强的鲁棒性。由仿真图可以看出，领导者输入的估计值可以渐近真实值，但是本文重点关注智能体的一致性问题，即使在40～50 s 存在误差，但是不影响系统达到一致性。

5 结论

本文研究了具有执行器故障和领导者输入下的领导—跟随多智能体系统的容错一致性问题。该协议由带补偿的自适应增益、固定增益和相邻智能体之间的状态信息组成。同时，引入性能指标函数，以减少零初始条件对系统的影响。最后，得到了保证系统实现容错一致性的充分条件，仿真结果表明了该方法的有效性。在未来，对于具有多类型执行器故障和切换拓扑的多智能体系统，如何在有限时间内实现容错一致性仍然是一个值得考虑的问题。