无人机集群系统的运动同步稳定控制机理研究

Download PDF 打印本文

引用本文

黄汉桥, 周欢, 王勇, 张蓬, 赵鑫. 无人机集群系统的运动同步稳定控制机理研究[J]. 西北工业大学学报, 2016, 34(6): 929-937. 复制到剪切板

Huang Hanqiao, Zhou Huan, Wang Yong, Zhang Peng, Zhao Xin. Study on Motion Syschronization Stability Control Mechanism of Unmanned Aerial Vehicle Swarm System[J]. Journal of Northwestern Polytechnical University, 2016, 34(6): 929-937. 复制到剪切板

无人机集群系统的运动同步稳定控制机理研究

黄汉桥^1,2,3, 周欢¹, 王勇¹, 张蓬², 赵鑫¹

1. 空军工程大学航空航天工程学院, 陕西西安 710038;
2. 西北工业大学, 陕西西安 710072;
3. 光电控制技术重点实验室, 河南洛阳 471009

收稿日期: 2016-09-01

基金项目: 航空科学基金（20155196022）、国家自然科学基金（61601505、71501184）与陕西省自然科学基金（2016JQ6050）资助

作者简介: 黄汉桥(1982-), 空军工程大学副教授, 主要从事无人飞行器作战系统与技术研究。

摘要: 为保证无人机集群执行任务的可靠性和飞行安全，将集群视为具有弱连通和有向加权网络的多智能体系统，研究其运动同步稳定控制问题。首先在一致性理论的基础上提出运动同步的概念，采用反馈线性化设计具有内外回路的分布式运动同步控制机制，根据矩阵理论和Lyapunov定理分析系统的稳定性，进而得到该系统的稳定性判据。仿真结果表明：所设计的稳定控制机制不仅能够依照期望的网络拓扑实现多智能体的精确运动同步，还能够确保系统的稳定性。

关键词: 多智能体运动同步无人机集群稳定控制控制系统稳定性反馈线性化智能计算线性矩阵不等式李雅普诺夫函数时间延迟

无人机自主协同面临的协同侦察、协同跟踪与协同打击等^[1-4]作战任务需求决定了其作战使用方式是多机集群系统^[5-8]。无人机集群在执行任务和飞行过程中, 必须能够及时地形成相对稳定的动态队形^[9], 同时, 根据目标任务的变化, 无人机集群还必须完成队形的实时变换, 在确保不发生碰撞的前提下重新取得稳定的集群队形。因此, 实现无人机集群系统的稳定控制对于确保集群飞行安全和完成任务的可靠性至关重要^[10-13]。

从宏观层面来说, 无人机集群系统的稳定性取决于系统中无人机之间的相对位置关系, 以及这种关系随时间变化的趋势和速率, 此时, 无人机就可以抽象为具有一定自主能力的智能体^[14], 而无人机集群自主协同系统的稳定控制就转化为多智能体系统的稳定控制。在多智能体系统的稳定控制方面, 一致性成为当前研究热点, 也是控制领域的重要研究课题^[15-16]。Su等^[17]通过对Olfati-Saber方法进行改进, 保证了多智能体系统的一致性, Xu等^[18]针对集群系统提出一种分布式的一致性协议, Hu等^[19]基于对比原理方法给出了保证系统达到一致的充分条件。然而在某些情况下, 完全一致是有害的。为此, 谢媛艳等^[20]研究了有向网络环境下一阶领导--跟随多智能体系统的滞后一致性问题, 纪良浩等^[21]研究了一类时延多智能系统的分组一致性问题。

对于具有leader的无人机集群系统, 最终的控制目的则是使系统内部智能体在leader的引导下, 其位置关系符合编队队形要求, 速度达到一致性要求, 这就是运动同步控制问题, 该问题既需要考虑编队的控制律设计, 又要考虑某些状态的一致性。然而, 当前典型的编队控制方法需要针对系统中的每个智能体设计控制律, 在智能体数量较大的情况下, 算法过于复杂, 求解效率低, 且该方法要求系统必须具备全局通信能力; 而单纯的一致性方法仅从宏观角度考虑控制协议问题, 虽然方法简单有效, 但在方法可行性和工程具体应用方面则存在诸多难题。因此, 从兼顾编队控制律和一致性的角度出发, 寻求一种多智能体系统的运动同步控制机制成为亟需, 就我们所知, 运动同步控制还未看到公开发表的研究结果。

1 问题描述与建模

令G={O, E, A}表示一个有向加权网络图, 且是弱连通的。其中O={0, 1, …, n}表示图G的n+1个节点集合, E⊆O×O表示图G的边集合, 再令O′={1, …, n}。∀i∈O′, j∈O, 图G的邻接矩阵A={a_ij}∈R^(n+1)×(n+1), 其中矩阵元素a_ij为节点i与节点j的连接权重, 当i可以得到j的信息时, a_ij>0, 称i与j连通, 此时, 图G中就存在一条有向边j→i; 否则a_ij=0。对于节点i, 将符合a_ij>0的所有节点j组成的集合记为O_i, O_i中元素的个数称为节点i的入度, 记为n_i=dim(o_i), 类似地, 定义出度为o_i。同时将所有接收节点0信息的节点的集合记为I₀。

∀i∈O′, 如果O_i∩I₀≠ø, 记:

那么, 若O_i∩I₀=ø, 则O_i^#=O_i。同时, 令:

考虑一个无人机集群, 包含1个leader和n个follower, 通信拓扑用上述图G表示。其中leader无人机对应节点0, follower无人机分别对应节点1到n, 为确保多智能体系统能够作为一个整体, 在节点1到n中, 至少存在1个节点与节点0连通。

无人机集群在编队飞行过程中, 通常要保持一定的飞行高度。对于二维平面内的多智能体系统, 不失一般性, 将无人机i的运动模型建为

(1)

式中, i∈O, p_i=[x_i y_i]^T是无人机i的位置矢量, V_i和ψ_i分别是速度和偏航角, V_i^c, ψ_i^c表示对应的控制输入, 常数α, β(α, β>0, ∈R)表示自动驾驶仪的控制增益。图 1给出了多智能体系统中任意2个相邻无人机成员的相对位置关系, 无人机i相对于无人机j的距离和视线角分别表示为d_ij和ψ_ij, 则有d_ji=d_ij。

图 1 任意2个智能体之间的相对位置关系

图选项

在多智能体系统中, leader无人机具有信息广播和决策资源通信的能力, 同时在轨迹规划、动态规划及避免冲突能力方面, 具有一定程度的自主性, 将leader无人机的参考轨迹定义为p₀^*=[x₀^*y₀^*]^T。

∀i, j∈O, 无人机i相对于无人机j的位置p_ij定义为

(2)

根据有向加权图定义, ∀i, j∈O, 当且仅当a_ij>0时, 认为无人机i相对于无人机j的期望位置p_ij^*有意义, 且定义为

(3)

式中, p_i^*、p_j^*分别表示无人机i与无人机j的期望位置, 当多智能体系统趋于稳定时, d_ij^*和ψ_ij^*是2个时不变参数, 其分别表示期望的相对距离和视线角, 这2个参数由多智能体系统的编队形状来决定, 同理, ∀i, j∈O, 当且仅当a_ij>0时, 认为d_ij^*和ψ_ij^*有意义。

由上述运动模型可知, 多智能体系统的运动取决于p₀^*、参数d_ij^*和ψ_ij^*, 一般地, 系统在稳定平衡状态时, 应满足如下2个条件:①各follower无人机均与leader无人机保持相同的偏航角ψ₀; ∀②i, j∈O, d_ij^*和ψ_ij^*保持不变。

为了便于给出运动同步的定义, 定义如下2个集合

(4)

式中, 表示误差变量, 且=p_i-p_i^*, , V_min, V_max分别表示无人机在某一飞行高度的最小平飞速度和最大平飞速度。

定义1 令, 若系统(1)的解满足, 则称多智能体系统(1)达到运动同步。

2 运动同步控制机制设计

为了实现多智能体系统的运动同步, 根据分布式协调控制理念, 针对系统内部每个无人机成员, 采用反馈线性化方法设计具有内外2个回路的分布式运动同步控制机制, 其中Follower无人机i (∀i∈O′)的控制机制结构如图 2所示。其中, 内回路用于控制无人机i的速度和偏航, 外回路通过使用局部信息(即无人机j的信息, 其中j∈O_i), 实现多智能体系统的稳定控制。

图 2 分布式运动同步控制机制结构

图选项

假设H_i, K_i∈R^2×2均是实对称的严格正定矩阵, I_2×2为2×2的单位矩阵, C_i∈R^2×4。令:

式中, 若无人机i与leader无人机连通(即a_i0>0), 则γ_i=1;否则γ_i=0。

根据反馈线性化设计思路, ∀i∈O, 应用于无人机i的内回路控制律表示为

(5)

而对于follower无人机, 即∀i∈O′, 应用于无人机i的外回路控制律表示为:

(6)

式中

(7)

此时, 应用于leader无人机的外回路控制律为

(8)

式中, =P₀-P₀^*。

在内回路控制律(5)作用下, 线性质点模型:

(9)

根据外回路控制律(6), ∀i∈O′, 可得

(10)

式中, , A_i=A^aux-B_iC_i, B_i=[0_2×2I_2×2]^T, , 且有:

(11)

式中, P_ij^*=P_j^*-P_i^*。

闭环系统受集群多智能体系统中无人机i的指令加速度、leader无人机的偏航角ψ₀以及leader无人机跟踪误差的激励, 其中leader无人机跟踪误差表示为C₀ ∈L₂∩L_∞(L_p(1≤p≤∞)表示勒贝格积分的线性赋范空间)。

3 稳定性分析

多智能体系统的稳定性在某种意义上是指多智能体系统运动状态轨迹的收敛性, 等价于上节所设计分布式运动同步控制机制的稳定性。考虑到leader跟踪误差对多智能体系统运动的影响, 定义如下误差信号: , ∀i∈O′, (10)式中误差动态特性可以表示为:

(12)

式中, A_fw=diag (A₁, …, A_n), B_fw=diag (B₁, …, B_n), Γ=[Γ₁^T…Γ_n^T]^T, H=[H₁^T…H_n^T]^T, =, 此时, 信号d (ψ₀, ₀, ₀, ₀^*)将leader无人机跟踪误差反馈作用到follower智能体运动误差的动态变化上。

同时, 定义

对于所有的∀i∈O′, 有:

(13)

注意到Δ₁取决于实际偏航角(ψ₁, …, ψ_n), 而Δ₂则取决于ψ₀, 、和, (13)式中的加速度可写为:

(14)

由于≡0, 此时对(12)式中第一个变量求导, 可得:

(15)

式中

因为, , 那么偏导数可以表示为:

(16)

式中

(17)

式中

同时, 由于存在如下2个约束条件:

(18)

则可知和是有界矩阵。因此, 对于所有的∀i∈O′, 将和表述为常数矩阵的凸组合是可行的。为简便起见, 省略参数和ψ_i的书写, 令:

因而M位于拓扑P_M的内部, 即:

这就意味着存在α_i^k>0, 使得:

(19)

可见, 在拓扑结构的每个顶点都是收敛的, 这就使得(12)式中动态误差变化的广义雅可比阵是一致负定的。

定理1 假设Leader智能体是由(5)和(8)式定义的闭环机制进行控制, 选择使A₀是Hurwitz阵的C₀, 同时假设O′中的每个follower智能体i的闭环控制律如(5)和(6)式所示。对某些矩阵Q=Q^T>0, 常数λ_Q>0和所有C_i, i∈O′, 满足下面矩阵不等式:

(20)

对于所有的X∈ , P_M的每一个顶点M_i^k, 且有:

(21)

令:

(22)

同时, 下列矩阵不等式组成立:

(23)

更保守地, 满足如下不等式组:

(24)

当H_i和K_i选择作为对角矩阵h_iI₂和k_iI₂。h_i和k_i分别被表示为形如h_1i+j′h_2i和k_1i+j′k_2i这样的复杂形式, 并且映射信号从L_p到L_p, p∈{2, ∞}, 这里j′代表复数的虚部。

那么, 对于具有足够小上界的| |, | |, | |和| |, 多智能体系统中每个无人机成员的位置和速度跟踪误差X将指数收敛于一个中心在原点, 半径为R_{B_d}的球B_d内。其中R_{B_d}的大小由下式决定:

(25)

式中, , ₀, ₀^*)‖, Q=Θ^TΘ。

若, 则R_{B_d}=0, 意味着轨迹X将收敛到0。

证明为了更好地证明上述定理, 先给出如下引理。

引理1 如果控制律(4)中的H_i和K_i满足一组可行的线性矩阵不等式(23)或者(24), 定义映射, 那么H+Γ是严格正实的。

当, 即leader完美地跟踪了预定轨迹时, (15)式变为:

(26)

此时, 令, 那么δX^TQδX沿(26)式对时间求导可得:

(27)

式中

由于X在中, 根据(19)式, 那么存在α_i^k和γ_i^k(M_i^k), 使得：

(28)

则：

(29)

需要注意的是, (20)式成立的一个必要条件是:

其服从于引理1。因此, 根据不等式(20), 由(29)式给出的导数会变成:

(30)

注意到:

则不等式(30)可化简为:

(31)

这说明当, 是收敛的, 且系统(12)的轨迹X收敛到0。如果不恒等于0, 而leader智能体的跟踪误差渐近趋于零, 那么结论仍然相同, 此时可有界表示为:

4 仿真实验与结果分析

考虑这样1个多智能体系统, 包括1个leader和5个follower, 其通信拓扑如图 3所示。

图 3 多智能体系统的通信拓扑

图选项

箭头表示智能体之间的信息流。由图中可看出, 智能体1和2与leader智能体直接相连, 假设控制增益为K_i, 智能体3、4和5不跟leader智能体直接相连, 则假设控制增益为H_i。同时, 设置(1)式中控制增益分别为α=0.25和β=0.30。

互连矩阵H+Γ由下式给出:

对于H_i, K_i∈R^2×2和C_i∈R^2×4分别根据矩阵不等(23)式和(20)式, 利用MATLAB 2013中的LMI Control工具箱进行求解, 得到

假定上述多智能体系统的目标是在时间[0 100 s]跟踪如下正弦轨迹:

并且要求在[0 50 s]内保持各个智能体之间的所有相对位置和相对角度分别满足d_ij^*=5 m和, 而在[50 100 s]内保持各个智能体之间的所有相对位置和相对角度分别满足d_ij^*=10 m和θ_ij^*=, 这相当于在t=50 s时刻, 给leader施加了突变的控制指令。follower无人机的初始位置坐标如下:

多智能体系统的运动轨迹、轴向位置误差及控制输入仿真结果分别如图 4~图 6所示。

图 4 多智能体系统的运动轨迹

图选项

从图 4可以看出，多智能体系统在[0 100 s]内均能够按照设置的拓扑结构保持稳定的编队队形进行飞行，并较好地跟踪正弦轨迹。为了清楚起见，图 5和图 6中只是给出了若干智能体的仿真曲线，其余智能体的仿真结果与其类似，可知虽然在t=50 s时刻，对该系统施加额外的控制输入后，系统的状态发生瞬变，但是多智能体很快能恢复到新的拓扑以形成新的编队队形，最终仍然能够实现运动同步和保持稳定运动状态。

图 5 相对位置的误差曲线

图选项

图 6 控制输入曲线

图选项

5 结论

本文研究了无人机集群系统的运动同步控制问题，采用反馈线性化方法设计了分布式协调运动同步控制律，并基于Lyapunov定理对其稳定性进行分析，最终得到了多智能体系统运动同步的稳定控制机制。数值仿真结果表明，所设计的稳定控制机制不仅能够实现多智能体系统精确的运动同步，还能确保系统的稳定性。对多智能体系统运动同步的稳定规模控制是下一步的研究重点。

参考文献

[1]	Sun T Y, Huo C L, Tsai S J, et al. Intelligent Flight Task Algorithm for Unmanned Aerial Vehicle[J]. Expert Systems with Applications, 2011, 38(8): 10036–10048. DOI:10.1016/j.eswa.2011.02.013

[2]	Pablo L, Seng K G, Eva B P, et al. Multi-UAV Target Search Using Decentralized Gradient-Based Negotiation with Expected Observation[J]. Information Sciences, 2014, 282: 92–110. DOI:10.1016/j.ins.2014.05.054

[3]	No T S, Kim Y, Tahk M J, et al. Cascade-Type Guidance Law Design for Multiple-UAV Formation Keeping[J]. Aerospace Science and Technology, 2011, 15(6): 431–439. DOI:10.1016/j.ast.2010.08.011

[4]	Manathara J G, Sujit P B, Beard R W. Multiple UAV Coalitions for a Search and Prosecute Mission[J]. Journal of Intelligent & Robotic Systems, 2011, 62(1): 125–158.

[5]	段敏, 高辉, 宋永端. 智能群体环绕运动控制[J]. 物理学报, 2014, 63 (14): 140204. Duan Min, Gao Hui, Song Yongduan. Distributed Encirclement Control of Multi-Agent Systems[J]. Acta Physica Sinica, 2014, 63(14): 140204. (in Chinese)

[6]	Zhang W G, Liu J Z, Zeng D L, et al. Consensus of Second-Order Multi-Agent Systems with Nonuniform Time Delays[J]. Chinese Physics B, 2013, 22(5): 050511. DOI:10.1088/1674-1056/22/5/050511

[7]	Duan H B, Luo Q N, Shi Y H, et al. Hybrid Particle Swarm Optimization and Genetic Algorithm for Multi-UAV Formation Reconfiguration[J]. IEEE Computational Intelligence Magazine, 2013, 8(3): 16–27. DOI:10.1109/MCI.2013.2264577

[8]	Karimoddini A, Lin H, Chen B M, et al. Hybrid Three-Dimensional Formation Control for Unmanned Helicopters[J]. Automatica, 2013, 49(2): 424–433. DOI:10.1016/j.automatica.2012.10.008

[9]	Zhang B C, Liu W Q, Mao Z L. Cooperative and Geometric Learning Algorithm (CGLA) for Path Planning of UAVs with Limited Information[J]. Automatica, 2014, 50(3): 809–820. DOI:10.1016/j.automatica.2013.12.035

[10]	茹常剑, 魏瑞轩, 沈东. 多无人机协同的稳定控制机理研究[J]. 物理学报, 2014, 63 (22): 220202. Ru Changjian, Wei Ruixuan, Shen Dong. Study on Stability Control Mechanism of Multiple Unmanned Aerial Vehicle Cooperative System[J]. Acta Physica Sinica, 2014, 63(22): 220202. (in Chinese)

[11]	Rajamani R, Piyabongkarn D N. New Paradigms for the Integration of Yaw Stability and Rollover Prevention Functions in Vehicle Stability Control[J]. IEEE Trans on Intelligent Transportation Systems, 2013, 14(1): 249–261. DOI:10.1109/TITS.2012.2215856

[12]	Erlien S M, Fujita S, Gerdes J C. Shared Steering Control Using Safe Envelopes for Obstacle Avoidance and Vehicle Stability[J]. IEEE Trans on Intelligent Transportation Systems, 2016, 17(2): 441–451. DOI:10.1109/TITS.2015.2453404

[13]	Dunbar W B, Caveney D S. Distributed Receding Horizon Control of Vehicle Platoons:Stability and String Stability[J]. IEEE Trans on Automatic Control, 2012, 57(3): 620–633. DOI:10.1109/TAC.2011.2159651

[14]	Lee G, Chong N Y. Decentralized Formation Control for Small-Scale Robot Teams with Anonymity[J]. Mechatronics, 2009, 19(1): 85–105. DOI:10.1016/j.mechatronics.2008.06.005

[15]	Zhu W, Cheng D Z. Leader-Following Consensus of Second-Order Agents with Multiple Time-Varying Delays[J]. Automatica, 1994, 46(12): 1994–1999.

[16]	Yu W W, Ren W, Zheng W X, et al. Distributed Control Gains Design for Consensus in Multi-Agent Systems with Second-Order Nonlinear Dynamics[J]. Automatica, 2013, 49(7): 2107–2115. DOI:10.1016/j.automatica.2013.03.005

[17]	Su H S, Wang X F. Flocking of Multi-Agents with a Virtual Leader[J]. IEEE Trans on Automatic Control, 2009, 54(2): 293–307. DOI:10.1109/TAC.2008.2010897

[18]	Xu X L, Chen S Y, Huang W, et al. Leader-Following Consensus of Discrete-Time Multi-Agent Systems with Observer-Based Protocols[J]. Neurocomputing, 2013, 118: 334–341. DOI:10.1016/j.neucom.2013.02.023

[19]	Hu H X, Liu A D, Xuan Q, et al. Second-Order Consensus of Multi-Agent Systems in the Cooperation-Competition Network with Switching Topologies:A Time-Delayed Impulsive Control Approach[J]. Systems & Control Letters, 2013, 62(12): 1125–1135.

[20]	谢媛艳, 王毅, 马忠军. 领导-跟随多智能体系统的滞后一致性[J]. 物理学报, 2014, 63 (4): 040202. Xie Yuanyan, Wang Yi, Ma Zhongjun. Delay Consensus of Leader-Following Multi-Agent Systems[J]. Acta Physica Sinica, 2014, 63(4): 040202. (in Chinese)

[21]	Ji L H, Liao X F. Consensus Problems of First-Order Dynamic Multi-Agent Systems with Multiple Time Delays[J]. Chinese Physics B, 2013, 22(4): 040203. DOI:10.1088/1674-1056/22/4/040203

[22]	Lechevin N, Rabbath C A, Sicard P. Trajectory Tracking of Leader-Follower Formations Characterized by Constant Line-of-Sight Angles[J]. Automatica, 2006, 42(12): 2131–2141. DOI:10.1016/j.automatica.2006.06.023

Study on Motion Syschronization Stability Control Mechanism of Unmanned Aerial Vehicle Swarm System

Huang Hanqiao^1,2,3, Zhou Huan¹, Wang Yong¹, Zhang Peng², Zhao Xin¹

1. Aeronautics and Astronautics Engineering College, Air Force Engineering University, Xi'an 710038, China;
2. Northwestern Polytechnical University, Xi'an 710072, China;
3. Science and Technology on Electro-Optic Control Laboratory, Luoyang 471009, China

Abstract: In recent years, with the growing development of artificial intelligence technology, multiple unmanned aerial vehicles (UAVs), especially the UAV swarm, have been widely used in military and civilized fields. In order to ensure the flight safety and reliability of completing tasks, the motion syschronization control problem is researched in this paper by viewing the UAV swarm as a multi-agent system with the directed-weighted and weakly connected dynamic network. The concept of the motion syschronization is defined based on the consistency. Then, the distributed control mechanism with double loops is designed by using the feedback linearization method. The stability of the control mechanism is analyzed based on the Lyapunov and matrix theorem, thus obtaining its judgment criterion of stability. Finally, a simulation example is given to verify the effectiveness of the control mechanism. The results show that the proposed control mechanism can not only realize precious motion syschronization according to expected network topology, but also ensure the stability of the multi-agent system.

Key words: multi-agent system motion synchronization unmanned aerial vehicle (UAV) swarm stability control control system stability feedback linearization intelligent computing linear matrix inequalities Lyapunov function MATLAB

time delay

西北工业大学主办。

文章信息

黄汉桥, 周欢, 王勇, 张蓬, 赵鑫

Huang Hanqiao, Zhou Huan, Wang Yong, Zhang Peng, Zhao Xin

无人机集群系统的运动同步稳定控制机理研究

Study on Motion Syschronization Stability Control Mechanism of Unmanned Aerial Vehicle Swarm System

西北工业大学学报, 2016, 34(6): 929-937.

Journal of Northwestern Polytechnical University, 2016, 34(6): 929-937.

文章历史

收稿日期: 2016-09-01

文章信息

文章历史

相关文章

工作空间