由于在编队控制[1-2]、目标跟踪[3]、覆盖控制[4]、姿态控制[5]等领域的广泛应用, 近年来多智能体系统的协同输出调节问题得到了越来越多的关注。
多智能体系统的协同控制问题可根据系统内有无领导者分为均匀一致性问题[6]和主从跟踪一致性问题[7]。本文研究的协同输出调节问题属于主从跟踪一致性问题, 该问题的解决需要达成2个条件:①保证闭环多智能体系统的稳定性; ②确保输出信号与外部信号之间的追踪误差趋近于零。该外部信号可代表外部输入或者外部干扰, 由外部系统(即领导者系统)产生。经典的多智能体系统输出调节问题最初由Davison、Francis等[8-9]提出, 但其控制器要求多智能体系统内的每个智能体不仅需要获知自身状态信息而且需要获知外部系统的状态变量信息。针对部分跟随者无法直接获知外部系统状态变量的多智能体系统, Huang等[7]提出了分布式协同控制算法以解决多智能体系统输出调节问题, 该项研究可被看作经典输出调节问题的延伸。随后, 文献[10-12]对多智能体系统协同输出调节问题进行了一系列扩展性研究, 但是这些研究中多数没有考虑多智能体通信网络中的时延现象或者假设时延为固定时延。
事实上, 大多数的多智能体系统都基于无线网络进行通信, 因此在智能体通信过程中不可避免地会产生通信时延[13], 文献[14]的研究对象为含有通信时延的多智能体系统, 但解决的是无领导者的多智能体系统一致性问题, 文献[15]研究了具有离散时间时延多智能体系统的输出调节问题, 但其关注的是固定时延。由于每个智能体所处的外部环境和通信目标是时变的, 智能体通信过程中发生的时延一般也为时变的。文献[16]研究了时变通信时延的多智能体一致性问题, 但其关注的是平均一致性问题。由于多智能体通信网络中时变时延的存在, 各智能体控制器将会无规律地异步更新邻居节点的状态信息, 这将为分布式反馈控制算法设计增加难度, 从而给多智能体系统协同输出调节问题的解决带来极大困难, 这是本文所面临的第一个难点。
另外, 在智能体通信过程中, 产生时变通信时延的同时数据丢失现象也将随机出现[17], 这将导致多智能体系统通信网络的拓扑结构动态地发生变化, 从而给多智能体闭环控制系统的稳定性分析和跟踪误差的收敛性分析造成极大困难。文献[18]研究了通信网络中存在数据丢包的多智能体一致性问题, 但其关注的是平均一致性问题。文献[11, 19-21]研究了动态网络拓扑下的多智能体输出调节问题, 但并未讨论数据丢包和通信时延同时存在时的一致性问题。文献[22]对多智能体系统动态网络拓扑下存在时延现象的输出调节问题进行了研究, 但其关注的是固定时延。目前已发表文献中, 对通信网络中同时存在数据包丢失和时变时延现象的多智能体系统协同输出调节问题的研究成果较少, 这也是本文所面临的第二个难点。
基于上述研究现状分析, 本文主要研究动态网络拓扑下具有时变通信时延的多智能体系统协同输出调节问题。本文通过引入队列机制, 将时变时延多智能体系统转化为具有固定时延和随机数据丢包的多智能体系统, 随后设计出相应的状态观测器, 进而提出分布式测量输出反馈控制算法。该算法能有效解决随机数据丢包和时变通信时延同时存在情况下的多智能体输出调节问题。针对不稳定和稳定外部系统, 分别给出了解决多智能体系统输出调节问题需要满足的条件。
1 问题阐述 1.1 图论多智能体系统通信网络拓扑结构可由简单有向图G=(V, E)表示, 其中V={v0, v1, …, vn}表示有向图中智能体的集合, E⊂V×V表示有向图的边集合。定义(vj, vi)表示从智能体vj到vi的边, 若存在(vj, vi), 则称vj为vi的邻居节点, 智能体vi的邻居节点集合可用Ni来表示。定义A={aij}为G的邻接矩阵, 其中aij=1⇔(vj, vi)存在, 否则aij=0。令LP={lij}为G的拉普拉斯矩阵, 其中lij=-aij⇔i≠j且
若有向图G中存在一个边序列(v1, v2), (v2, v3), …, (vk-1, vk), 则称vk由v1可达。若有向图G中的每一个智能体都由vi可达, 则称图G中至少包含一个以vi为根的生成树。
1.2 队列机制考虑引入文献[15]中的队列机制来处理多智能体通信过程中伴随的时变时延现象。
假设G内的所有智能体时钟同步并且数据包都以h为周期向外发送。令τ (dmin < τ < h)表示每个智能体数据接收器的队列时间, 其中dmin表示时变通信时延的最小值。以第k个周期为例:
在t∈[kh, kh+τ)内, 当有数据包到达vi的接收器时, vi将检查该数据包的时间戳, 若该数据包在kh时刻被发送, 则vi将其放入队列中, 否则该数据包将被丢弃; 在t=kh+τ时刻, vi将利用接收器队列中的数据更新其控制输入; 在t∈[kh+τ, (k+1)h)内, 所有到达vi的数据均被看为过时信息而被丢弃。通过引入队列机制, 在每个周期内G内的所有智能体都将在t=kh+τ时刻同步更新控制输入。
假设1 通信网络中, 任意2个智能体的通信与其他智能体无关; 独立同分布的时变通信时延服从均匀分布U[0, dmax], 其中dmax为最大通信时延; 随机丢包过程服从伯努利分布。
1.3 系统描述一般情况下, 固定拓扑下无时延的线性离散多智能体系统中的跟随者系统可表示为如下形式:
![]() |
式中, i=1, …, n, xi∈Rp, ui∈Rq, ei∈Rc, υ∈Rd分别表示第i个智能体系统的状态, 控制输入, 追踪误差和外部信号; Ai∈Rp×p, Bi∈Rp×q, Ei∈Rp×d, Ci∈Rc×p, Di∈Rc×q和Fi∈Rc×d均为常数矩阵; ymi∈Rcm表示第i个智能体的测量输出, 其中, 角标中的m表示此变量为测量值, i指代第i个智能体; Cmi∈Rcm×p, Dmi∈Rcm×q, Fmi∈Rcm×d。
外部信号υ可以表示外部输入或外部干扰, 它可由如下外部系统产生
![]() |
式中, S∈Rd×d为常数矩阵。
为保证信息传输的时效性, 假设本文研究的多智能体系统中只有邻居节点之间才有数据传输, 并且各智能体不对外转发其所接收的各项信息。因此, 若智能体vj是智能体vi的邻居节点, 则vi只能将vj的状态信息作为vi自身的控制输入, 而不能作为中继器将vj的信息转发给其他智能体vk。由于不能保证每个跟随者的邻居节点集合中都包含有领导者, 为保证无法接收外部信号的跟随者也能实现对领导者的跟踪控制, 可考虑设计如下分布式测量输出反馈控制算法
![]() |
式中, Ki1∈Rq×p, Ki2∈Rq×d和Li∈Rp×cm为3个增益矩阵, 参数ϕ为大于零的实数,
通过应用该分布式控制算法, 即使智能体vi无法直接获知外部信号υ, 也可通过获取其邻居节点vj的状态观测器所产生的外部系统状态估计值
若多智能体系统通信网络拓扑中存在随机数据丢失和时变通信时延, 则外部系统状态观测器
定义初始网络拓扑表示为G(0)=(V(0), E(0)), 其中V(0)={v0, …, vn}, v0表示领导者, {v1, …, vn}表示跟随者。在队列机制下, 智能体vi在[kh, kh+τ)时间内只能接收其邻居节点发送的外部系统状态信息υ(kh)或者对外部系统状态信息的估计值
定义A(k)={aij(k)}为时间[kh, kh+τ)内的期望邻接矩阵, 随即可得相应于A(k)的期望网络拓扑G(k)和期望拉普拉斯矩阵LP(k), 其中
![]() |
若定义GS(kh)={G1(kh), G2(kh), …, GΝ(kh)}表示多智能体系统在第k个采样周期的队列时间内出现的所有网络拓扑的集合, 则期望拓扑G(k)可看作是这N个网络拓扑的联合网络拓扑, 即G(k)=G1(kh)∪G2(kh)∪…∪GΝ(kh)。
在队列机制下, 针对通信网络中存在随机数据丢失和时变通信时延的多智能体系统, 考虑描述跟随者系统如(1)式所示
![]() |
(1) |
外部系统如(2)式所示
![]() |
(2) |
(1) 式和(2)式共同构成了本文研究的动态网络拓扑环境下具有时变通信时延的多智能体系统, 该系统包含n+1个多智能体, 其中, (1)式表示跟随者系统, (2)式表示领导者系统。
在队列机制下, 设计外部系统状态变量的动态观测器如下
![]() |
(3) |
式中,
针对智能体不能直接测量自身状态信息的情况, 设计自身状态变量动态观测器如下
![]() |
(4) |
因此, 结合(3)式和(4)式可设计分布式测量输出反馈控制算法如(5)式所示
![]() |
(5) |
结合(1)~(5)式可得智能体vi的闭环控制系统如下所示
![]() |
令
![]() |
同理定义B, C, D, E, F, Cm, Fm, L。令K1=blockdiag(K11,…,Kn1),K2=blockdiag(K12,…,Kn2),x(k)=[x1T (kh+τ),…,xnT(kh+τ)]T,
![]() |
(6) |
式中, In⊗S表示单位矩阵In与矩阵S的克罗内克积,1n表示元素为1的n维列向量。
![]() |
![]() |
定义1 给定多智能体系统(6), 若存在分布式测量输出反馈控制算法(5)使得离散时间闭环多智能体系统满足:
1) 当外界输入为零时, 闭环多智能体系统渐进稳定;
2) 对于任意的初始条件y(0)和
则表明动态网络拓扑环境下多智能体系统的协同输出控制问题可被反馈控制算法(5)解决。
2 主要结论在保证一般性的前提下, 首先给出解决多智能体协同输出调节问题的标准假设条件:
假设2 外部系统的系统矩阵S的所有特征值的模均不小于1。
假设3 (Ai, Bi)是可镇定的, i=1, …, n。
假设4 (Cmi, Ai)是可观测的, i=1, …, n。
假设5 存在适当的队列时间τ, 使得有向图G在每个队列时间结束时的期望拓扑结构G(k)中都至少存在一个以v0为根的生成树。
定理1 若假设1~5同时成立, 令增益矩阵Ki1和Li分别满足假设3和假设4, 当且仅当参数ϕ(k)和Ki2在每个周期内同时满足以下2个条件:
1)
![]() |
式中, Δ=al2 (k)+bl2 (k)-(albs-asbl)2>0, asal(k)+bsbl(k)>0, s=1, …, q, l=1, …, n;
2) 矩阵方程
![]() |
有解(Xi, Ki2);
则称反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体系统(6)的协同输出调节问题。
证明:
令
![]() |
则可得
![]() |
由于Al(k)为上三角矩阵, 则可通过分析G和
令
由假设3可得, 存在矩阵K1使得A+BK1的所有特征值的模均小于1;由假设4可得, 存在矩阵L使得A-LCm的所有特征值的模均小于1。因G为上三角矩阵, 当选取满足假设3和假设4的增益矩阵K1和L时可判定G的特征值的模均小于1。由于G与G互为相似矩阵, 因此G的所有特征值的模小于1。
定义矩阵S的特征值为{as+jbs, s=1, …, d}, 其中当0≤s≤q1时, bs=0;当q1+1≤s≤d时, bs≠0。同理定义
假设5成立时, 由文献[8]的引理1和文献[5]的引理3.3可得, 每个周期内
由克罗内克积的性质可得
![]() |
式中, Δ=al2 (k)+bl2 (k)-(albs-asbl)2>0且asal(k)+bsbl(k)>0, s=1, …, d, l=1, …, n。
令
![]() |
由于S的特征值的模均不小于1, 所以
![]() |
综上可得, 在假设1~5同时成立的前提下, 当且仅当参数ϕ(k)和Ki2在每个周期内均满足定理1的2个条件时, 反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体系统协同输出调节问题。
假设6 外部系统的系统矩阵S的所有特征值的模均小于1。
定理2 若假设1和假设3~6同时成立, 令增益矩阵Ki1和Li分别满足假设3和假设4, 当且仅当参数ϕ(k)在每个周期内均满足
![]() |
式中, Δ=al2 (k)+bl2 (k)-(albs-asbl)2>0, s=1, …, d, l=1, …, n;
则称反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体系统(6)的协同输出调节问题。
证明:
同理定理1的证明过程可得, 若选取满足假设3和假设4的增益矩阵Ki1和Li, 当且仅当参数ϕ(k)在每个周期内均满足
![]() |
闭环多智能体系统在外界输入为零的情况下渐进稳定, 其中Δ=al2 (k)+bl2 (k)-(albs-asbl)2>0, s=1, …, d, l=1, …, n。
由假设6得
![]() |
式中, Δ=al2 (k)+bl2 (k)-(albs-asbl)2>0, s=1, …, d, l=1, …, n。
当假设6成立时
综上可得, 在假设1和假设3~6同时成立的前提下, 当且仅当存在参数ϕ(k), 使得定理2中给出的条件在每个周期内均成立, 则测量输出反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体系统协同输出调节问题。
3 仿真结果与分析本节以如下多智能体系统为例进行仿真分析。
假设跟踪者系统如下所示
![]() |
其领导者系统为如下形式
![]() |
若转换为(1)式和(2)式所示形式, 可得
![]() |
令Ki1=[-1.5, -0.5], Li=[-1.5, -3]T。显然, 假设3和假设4成立。
本节所研究的多智能体系统中存在5个多智能体, 其中节点0代表领导者, 节点1~4代表跟随者。初始时刻的多智能体网络拓扑如图 1所示, 此拓扑结构中存在以0节点为根的有向生成树。
![]() |
图 1 初始网络拓扑G(0) |
由于多智能体系统在通信过程中存在随机的数据丢包, 多智能体的通信网络在[kh, kh+τ]内的不同时刻会具有不同形式的拓扑结构, 在某些特定时刻其网络拓扑结构中将不再存在生成树, 如图 2所示。
![]() |
图 2 数据丢包时的网络拓扑集合GS(kh) |
为便于理论分析, 本节中假设多智能体网络拓扑结构在每个周期的队列时间内只能在图 2所示的4种拓扑结构中相互变换。因此, 在第k个采样周期的队列时间内, 含有生成树的期望网络拓扑只能为图 3所示的拓扑结构之一。令{Gi(k); i=1, 2, 3, 4}分别表示图 3a)~3d)中的网络拓扑结构, Ai(k)为相应于Gi(k)的邻接矩阵,
![]() |
图 3 期望网络拓扑G(k) |
从图 3a)中可得:
![]() |
因此,
![]() |
ϕ(k)=0.4, 则定理1的2个条件均成立。由定理1可知, 分布式测量测量输出反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体协同输出调节问题, 仿真结果如图 4所示。
![]() |
图 4 外部系统不稳定时跟随者的追踪误差 |
若领导者的系统矩阵
![]() |
图 5 外部系统稳定时跟随者的追踪误差 |
由图 4和图 5可得, 针对不稳定和稳定的外部系统, 测量输出反馈控制算法(5)均可使得其所有跟随者的跟踪误差渐进趋向于零, 动态网络拓扑环境下存在时变通信时延的多智能体系统协同输出调节问题可以被有效解决。
4 结论本文研究了动态网络拓扑下具有时变通信时延的多智能体系统协同输出调节问题。主要得到以下3项结论:①基于队列机制, 设计了新的分布式测量输出反馈控制算法以解决具有随机数据丢包和时变通信时延的多智能体系统协同输出调节问题; ②在标准假设成立的前提下, 针对不稳定外部系统, 给出了动态网络拓扑下具有时变通信时延的多智能体系统协同输出调节问题的解决条件; ③在标准假设成立的前提下, 针对稳定外部系统, 给出了动态网络拓扑下具有时变通信时延的多智能体系统协同输出调节问题的解决条件。仿真分析验证了本文所提出的测量输出反馈控制算法能够有效解决具有通信时延和数据丢失的多智能体系统协同输出调节问题。另外, 在基于队列机制的多智能体系统协同输出调节问题中, 队列时间的取值十分重要, 因此, 最优队列时间问题将是未来工作的重心之一。
[1] | LI H, SHI Y. Robust Distributed Model Predictive Control of Constrained Continuous-Time Nonlinear Systems:a Robustness Constraint Approach[J]. IEEE Trans on Automatic Control, 2014, 59(6): 1673-1678. DOI:10.1109/TAC.2013.2294618 |
[2] | LI H, YAN W. Receding Horizon Control Based Consensus Scheme in General Linear Multi-Agent Systems[J]. Automatica, 2015, 56: 12-18. DOI:10.1016/j.automatica.2015.03.023 |
[3] |
陈旿, 李胆胆, 左颖, 等. 一种基于马尔可夫随机场的多无人航行体的协同一致性算法[J]. 西北工业大学学报, 2017, 35(1): 50-58.
CHEN Wu, LI Dandan, ZUO Yin, et al. A Collaborative Consensus Algorithm for Multiple Unmanned Vehicles Based on Markov Random Field[J]. Journal of Northwestern Polytechnical University, 2017, 35(1): 50-58. (in Chinese) DOI:10.3969/j.issn.1000-2758.2017.01.009 |
[4] | ZUO L, YAN W, YAN M. Efficient Coverage Algorithm for Mobile Sensor Network with Unknown Density Function[J]. IET Control Theory & Applications, 2017, 11(6): 791-798. |
[5] | LI H, YAN W, SHI Y. Continuous-Time Model Predictive Control of Under-Actuated Spacecraft with Bounded Control Torques[J]. Automatica, 2017, 75: 144-153. DOI:10.1016/j.automatica.2016.09.024 |
[6] | REN W, BEARD R W. Consensus Seeking in Multiagent Systems under Dynamically Changing Interaction Topologies[J]. IEEE Trans on Automatic Control, 2005, 50(5): 655-661. DOI:10.1109/TAC.2005.846556 |
[7] | SU Y, HUANG J. Cooperative Output Regulation of Linear Multi-Agent Systems[J]. IEEE Trans on Automatic Control, 2012, 57(4): 1062-1066. DOI:10.1109/TAC.2011.2169618 |
[8] | DAVISON E J. The Robust Control of a Servomechanism Problem for Linear Time-Invariant Multivariable Systems[J]. IEEE Trans on Automatic Control, 1976, 21(1): 25-34. DOI:10.1109/TAC.1976.1101137 |
[9] | FRANCIS B A, WONHAM W M. The Internal Model Principle of Control Theory[J]. Automatica, 1976, 12(5): 457-465. DOI:10.1016/0005-1098(76)90006-6 |
[10] | SU Y, HUANG J. Cooperative Output Regulation with Application to Multi-Agent Consensus under Switching Network[J]. IEEE Trans on Systems Man & Cybernetics Part B, 2012, 42(3): 864-875. |
[11] | LIU Z, YAN W, LI H. Cooperative Output Regulation of Multi-Agent Systems with Stochastic Data Losses[C]//IEEE Chinese Control Conference, 2016: 8020-8025 |
[12] | SEYBOTH G S, REN W. Cooperative Control of Linear Multi-Agent Systems via Distributed Output Regulation and Transient Synchronization[J]. Automatica, 2016, 68(C): 132-139. |
[13] | WU X, TANG Y, ZHANG W. Stability Analysis of Stochastic Delayed Systems with an Application to Multi-Agent Systems[J]. IEEE Trans on Automatic Control, 2016, 61(12): 1-1. DOI:10.1109/TAC.2016.2616651 |
[14] | Olfati-Saber R, Murray R M. Consensus Problems in Networks of Agents with Switching Topology and Time-Delays[J]. IEEE Trans on Automatic Control, 2004, 49(9): 1520-1533. DOI:10.1109/TAC.2004.834113 |
[15] | HUANG J, YAN Y. Cooperative Output Regulation of Discrete-time Linear Time-delay Multi-agent Systems[J]. IET Control Theory & Applications, 2016, 10(16): 2019-2026. |
[16] | ZHANG Y, TIAN Y P. Consensus of Data-Sampled Multi-Agent Systems with Random Communication Delay and Packet Loss[J]. IEEE Trans on Automatic Control, 2010, 55(4): 939-943. DOI:10.1109/TAC.2010.2041612 |
[17] | LI H, SHI Y. Network-based Predictive Control for Constrained Nonlinear Systems with Two-Channel Packet Dropouts[J]. IEEE Trans on Industrial Electronics, 2014, 61(3): 1574-1582. DOI:10.1109/TIE.2013.2261039 |
[18] | ZHANG W, TANG Y, HUANG T, et al. Sampled-Data Consensus of Linear Multi-Agent Systems with Packet Losses[J]. IEEE Trans on Neural Networks and Learning Systems, 2017, 28(11): 2516-2527. DOI:10.1109/TNNLS.2016.2598243 |
[19] | MENG Z, YANG T, DIMAROGONAS D V, et al. Coordinated Output Regulation of Heterogeneous Linear Systems under Switching Topologies[J]. Automatica, 2015, 53: 362-368. DOI:10.1016/j.automatica.2015.01.009 |
[20] | LIU W, HUANG J. Cooperative Global Robust Output Regulation for Nonlinear Output Feedback Multi-Agent Systems under Directed Switching Networks[J]. IEEE Trans on Automatic Control, 2017, 62(12): 6339-6352. DOI:10.1109/TAC.2017.2712747 |
[21] | SU Y, HUANG J. Cooperative Output Regulation with Application to Multi-Agent Consensus Under Switching Network[J]. IEEE Trans on Systems, Man, and Cybernetics, 2012, 42(3): 864-875. DOI:10.1109/TSMCB.2011.2179981 |
[22] | LU M, HUANG J. Cooperative Output Regulation Problem for Linear Time-Delay Multi-Agent Systems under Switching Network[J]. Neurocomputing, 2016, 190: 132-139. DOI:10.1016/j.neucom.2016.01.025 |