2. 西北工业大学无人机研究所, 陕西西安 710065
无人机(unmanned aerial vehicle,UAV)编队飞行属于一个较新的研究领域,因其特有的协同优势和作战效率,逐渐成为近年来的研究热点,并在区域搜索、环境监测、空中监视、协同作战等民用和军事领域具有广泛应用前景[1]。
现有研究将编队策略归结为以下3类:长机-僚机法(leader-follower)[2]、基于行为法(behavior-based)[3]和虚拟结构法(virtual structure)[4, 5]。长机-僚机法是将编队中的某架UAV设定为长机角色,负责编队的航迹规划和生成等任务,其他飞机则被设定为僚机角色,负责跟踪长机以实现编队队形的保持,这种方法的最大优点就是简单易行,编队航迹完全由长机决定,缺点是存在跟踪误差扩散,不适于多机编队执行复杂机动的情况[5]。基于行为法由一系列基本行为组成:碰撞避免,障碍物规避,目标搜索,队形保持。无人机的控制行为一般为这四种基本行为的加权平均,该方法适用性较强,适用于不确定环境,但是缺乏相应的理论分析基础[3]。虚拟结构法采用一个虚拟刚体来描述期望的编队构型,并用虚拟结构的运动轨迹来描述整个编队的运动,虚拟结构法的优点是将整个编队看作一个整体,简化了任务的描述和分配,可以容易地指定机群的行为,缺点是不容易实现障碍物规避,缺乏灵活性。
当前基于虚拟结构法的编队控制研究已经取得一些成果,文献[5]基于虚拟结构编队策略,采用非线性模型预测方法实现多UAV编队飞行控制,但由于缺乏各UAV到虚拟点的队形反馈信息,编队机动时的队形误差较大。文献[6]提出了一种灵活虚拟结构编队策略实现编队保持控制,使得UAV编队转弯更平滑,但依然没有加入队形反馈策略[7]。对于这种缺乏UAV到虚拟点信息交流的情况,当虚拟点沿编队参考轨迹执行大机动时,若给定的参考机动轨迹不合理,编队UAV由于受到自身性能约束(如转弯角速率饱和)则无法保持对虚拟结构点的跟踪,进而造成队形误差扩大,甚至编队破裂。
本文基于虚拟结构编队策略,采用非线性模型预测方法结合编队反馈思想,针对编队执行平面大机动时的队形误差扩大问题展开研究。
1系统建模 1.1 UAV单机模型目前关于飞机内回路姿态控制(即飞机自驾仪)的研究已经较为成熟,假设各UAV均装备有相同的速度保持、航向保持和高度保持自驾仪。又实际飞行中的无人机编队多以平飞为主,因此假设各UAV均已由高度保持自驾仪保持在同一高度飞行,第i架UAV平面内的自驾仪模型[2]如下:
式中:Vic 和χic 分别为速度和航向角指令,τV,τχ为自驾仪常数,并假设各UAV的速度和角速度包线分别为0<Vmin≤Vi≤Vmax,|ωi|≤ωmax。
1.2 编队平面相对运动模型本文采用虚拟结构编队策略,假设存在一个运动的虚拟点Of沿编队参考轨迹飞行,以该虚拟点为原点定义编队坐标系Ofxfyf,其中xf轴沿虚拟点速度方向,yf轴位于水平面内并垂直于xf轴,见图 1,图中Ogxgyg为惯性系。定义期望编队队形由编队坐标系下的一组位置坐标{(xifd,yifd),i=1,…,m}来表示,其中,m为组成编队的UAV总数,下标f表示虚拟点。
图中Vf和χf为虚拟点速度和航向,Vi和χi为UAV速度和航向角,(xif,yif)为编队坐标系下的UAV位置,Ri、Rf和Rif分别为惯性系下UAV位置矢量、虚拟点位置矢量及它们之间的相对位置矢量,则它们之间满足如下三角关系:
对(2)式关于时间求导,并利用坐标转换关系投影到编队坐标系下,可得如下平面相对运动方程:
式中,航向角误差χei=χi-χf,虚拟点角速度,i=1,…,m。
假设期望队形不变,令相对位置误差xeif=xif-xifd,yeif=yif-yifd,并代入(3)式可得编队平面相对运动误差方程如下:
1.3 编队参考轨迹及虚拟点运动方程本文采用基于时间参数化的微分方程来描述编队参考轨迹,即:
式中:(xr,yr,χr)为编队参考位置和航向,Vr和ωr为已知参考轨迹指令,通常由路径规划系统提前给出,下标r表示参考轨迹。
设虚拟点运动满足不完全约束条件[8],即:
式中:(xf,yf,χf)为虚拟点位置和航向,虚拟点速度Vf和角速度ωf为虚拟点轨迹控制输入,用以实现对编队轨迹进行调整。
2 控制器设计本文将队形保持器和虚拟点编队轨迹跟踪器分开设计,队形保持器用于实现保持各UAV在编队坐标系下的期望位置;虚拟点轨迹跟踪器用于保证虚拟点沿参考轨迹飞行,同时能够根据反馈的队形误差信息做出轨迹调整以保证队形性能。采用的控制结构如图(2)所示,假设各UAV间的通讯带宽足够,且不考虑通讯延迟。
2.1 队形保持器这里采用李雅普诺夫第二法(直接法)设计控制律(Vic,χic)以实现第i个UAV对其期望位置(xifd,yifd)的稳定保持。定义李雅普诺夫函数为:
显然VLi为正定,对其求导并将(4)式代入得,
根据李雅普诺夫稳定性定理,当时,编队相对位置误差(xeif,yeif)渐进趋于零,因此这里令
式中,增益kxi>0,kyi>0,i=1,…,m,则
显然为负定,进而可由(9)式解得如下非线性控制律:
为获得更高的控制效率和鲁棒性,采用如下非线性函数处理上述控制律中的反馈误差量[9]:
式中:e代表误差量xeif和yeif,0<α<1,2δ为非线性函数中间线性段长度,用于避免数值仿真带来的高频颤振[9]。仿真发现,为消除系统稳态误差并改善系统震荡特性,还需加入积分和微分环节(为简单起见,积分和微分环节中的误差量不作非线性处理),进而得到队形保持控制律:
式中:kIxi,kDxi,kIyi,kDyi,i=1,…,m,分别为纵向和横向的积分、微分增益,此处虚拟点的速度、航向角和角速度看作扰动输入。
2.2 含队形反馈的虚拟点非线性模型预测控制器模型预测控制(model predictive control,MPC)又称滚动时域控制(receding horizon control,RHC),是一种基于模型的有限时域开环最优算法,其基本思想是利用被控对象的模型来预测被控对象在未来一定有限时域内的输出,按照基于反馈校正的某个优化目标函数,优化计算得到当前及未来一定时域内的一组控制序列,且在当前控制周期内仅将优化得到的当前时刻控制量作用于被控对象,直到下一控制周期重复之前的步骤重新优化计算控制序列[10]。若基于控制对象的预测模型为非线性模型,即所谓的非线性模型预测控制(nonlinear model predictive control,NMPC)。
为实现编队队形反馈,在前述队形保持器基础上,采用NMPC法设计虚拟点轨迹跟踪器,具体控制结构如图 3所示,图中N为预测时域长度。
2.2.1 参考轨迹将方程(5)改写成离散状态空间形式:
式中,状态向量Xr(k)=(xr(k),yr(k),χr(k))T,参考输入向量Ur(k)=(Vr(k),ωr(k))T。由于任意时刻的参考输入Ur(k)已知,因此从当前时刻开始的未来N步的预测参考轨迹位置可由方程(14)得到。
2.2.2 预测模型由于需要将队形反馈加入到NMPC控制器中,因此这里的预测模型包含两部分:虚拟点运动预测模型和队形预测模型。
虚拟点运动预测模型即为方程(6),写成离散状态空间形式如下:
式中:状态向量Xf(k)=(xf(k),yf(k),χf(k))T,控制输入Uf(k)=(Vf(k),ωf(k))T。
为简单起见,忽略控制律(13)的积分项和微分项后代入(1)式,联立方程(4),即得到关于虚拟点控制输入的编队队形预测模型,写成离散状态空间形式为:
状态向量Xi(k)=(Vi(k),χi(k),xeif(k),yeif(k))T,控制输入向量Uf(k)=(Vf(k),ωf(k))T,i=1,…,m。
2.2.3 代价函数设计根据控制设计目的,所设计的代价函数应包含3个部分:队形性能代价、参考指令跟踪代价和编队轨迹代价。设当前时刻为k,则定义未来N步时域内的代价函数如下:
式中:代价函数的三部分依次对应于队形代价、参考指令代价和编队轨迹代价,Q、S和R分别为对应权矩阵。
由队形误差反馈原理可知,编队执行大机动时通过队形反馈信息调整虚拟点的运动来改善队形保持,即队形的改善是以编队偏离原参考轨迹为代价的,因此这里设计一个动态参数用于动态调整权矩阵S和R,以实现编队队形保持和沿参考轨迹飞行之间的自适应调整。
定义编队队形性能指标如下(队形性能指标也可采用其他形式定义,见文献[4]):
同理定义虚拟点跟踪编队参考轨迹性能指标为:
式中,(xf,yf)、(xr,yr)分别为当前时刻惯性系下虚拟点位置和参考位置。令
式中,η>0为调节参数,γ∈[0, 1],γ越小表明队形误差越大,此时希望代价函数中队形误差代价增大以改善队形误差,反之γ越大表明编队偏离参考轨迹越大,此时希望代价函数中的轨迹代价项增大以使得编队沿参考轨迹飞行。因此,定义权矩阵R和S分别由下式给出:
式中,IN和0N分别为N阶单位矩阵和零矩阵,rx,ry,sx,sy,sχ为常数。
2.2.4 滚动优化问题为实现含队形反馈的虚拟点轨迹跟踪,在当前时刻k下,需求解如下有限时域最优控制问题以得到虚拟点运动指令:
式中,χf、χi和μf分别为状态约束和控制约束。对于一般的非线性优化控制问题,常见求解算法有序列二次规划法、Lagrange乘子法、内点法等,本文采用Matlab自带的优化工具箱进行优化求解。
综上所述,含队形反馈的虚拟点NMPC控制器的基本求解过程为:
1) 当前时刻k,根据当前虚拟点状态和编队队形信息以及当前参考轨迹信息,求解优化问题(22),得到未来N步的最优控制序列{Uf(k),…,Uf(k+N-1)};
2) 将最优控制序列的第一项作为虚拟点运动指令作用于编队各机,其余N-1项以
形式存储下来,作为下一采样时刻求解优化问题初始猜测值以提高优化速度。
3) k=k+1,回到第一步。
3 仿真实验为验证所设计的队形保持器和虚拟点NMPC控制器的有效性以及队形反馈在编队保持中的作用,下面以常见的双机斜对角编队飞行为例,在Matlab Simulink环境下进行仿真实验。
3.1 仿真参数自驾仪参数τV=10/3 s-1,τχ=5 s-1,虚拟点及各UAV速度和转弯角速率约束均为Vmin=18 m·s-1,Vmax=31 m·s-1,ωmax=0.05 rad·s-1。期望的编队队形为(x1fd,y1fd)=(25 m,25 m),(x2fd,y2fd)=(-25 m,-25 m)。fal(e,α,δ)的参数为α=0.2,δ=0.5,控制增益kxi=1,kyi=2,kIxi=0.1,kDxi=0.5,kIyi=0.01,kDyi=0.1,i=1,2。编队初始状态见表 1,仿真时间300 s,离散时间步长0.2 s,预测长度N=6。编队参考轨迹及虚拟点初始位置为:
权矩阵Q、R和S分别为:
动态参数γ由式(20)求得,调节参数η=3.5。
3.2 结果分析仿真结果如图 4~图 8所示,图 4a)~图 7a)为不含队形反馈策略时的仿真结果;图 4b)~图 7b)为含队形反馈策略时的仿真结果;图 8为2种情况下虚拟点轨迹(不含队形反馈时的虚拟点轨迹即为编队参考轨迹),并给出了含队形反馈策略下t=0 s、100 s、120 s、150 s、200 s 5个时刻的两UAV位置。由编队保持的相对位置误差可以看出,由于编队参考轨迹要求虚拟点以最大角速率作机动转弯,受UAV本身性能约束(主要是最大转弯角速率约束),无队形反馈情况下,队形误差不断变大直到编队机动指令结束;而含有队形反馈策略时,编队机动段的队形误差得到显著改善并保持在较小范围,这是因为虚拟点根据反馈的队形信息并未严格按照参考轨迹给出的指令进行机动,而是在参考指令附近对速度和角速度进行调整以控制队形误差在较小范围内,见图 6b)~图 7b)。然而,虚拟点的运动调整意味着对原参考轨迹机动段进行局部重新调整,即采用队形反馈提高队形保持能力是以偏离原编队参考轨为代价的,这由图 8可以明显看出,编队开始执行大机动转弯指令时,队形误差增大,此时虚拟点根据队形反馈信息,偏离原来的参考轨迹并以一个更大的转弯半径进行转弯,当队形保持误差控制在一定范围内,虚拟点再调整速度和航向回到原参考轨迹上。
4 结 论本文针对UAV编队大机动飞行时的队形误差扩散问题展开研究,首先根据李雅普诺夫稳定理论设计了稳定的队形保持器,并在此基础上采用非线性模型预测方法结合编队反馈思想设计了虚拟点NMPC控制器以提高编队队形性能。仿真表明本文设计的含队形反馈策略的虚拟点NMPC控制器能够很好地克服编队大机动时由于参考机动轨迹不合理而带来的队形误差扩散问题,提高了编队大机动时的队形性能。
[1] | 朱战霞,袁建平.无人机编队飞行问题初探[J].飞行力学, 2003, 21(2):166-169 Zhu Zhanxia, Yuan Jianping. Discuss on Formation Flight of UAV[J]. Flight Dynamics, 2003, 21(2):166-169(in Chinese) |
Cited By in Cnki (86) | Click to display the text | |
[2] | Pachter M, D'Azzo J J, Dargan J L. Automatic Formation Flight Control[J]. Journal of Guidance, Control, and Dynamics, 1994, 17(6):1380-1383 |
Click to display the text | |
[3] | Anderson M R, Robbins A C. Formation Flight as a Cooperative Game[C]//Proceedings of the AIAA Guidance, Navigation and Control Conference, Boston MA:American Institute of Aeronautics and Astronautics, 1998:244-251 |
Click to display the text | |
[4] | Brett J Y, Randal W B, Jed M K. A Control Scheme for Improving Multi-Vehicle Formation Maneuvers[C]//Proceedings of the American Control Conference. Arlington, 2001:25-27 |
Click to display the text | |
[5] | Chao Zhou, Zhou Shaolei, Ming Lei, et al. UAV Formation Flight Based on Nonlinear Model Predictive Control[J]. Mathematical Problems in Engineering, 2012:1-15 |
Click to display the text | |
[6] | Low C B, Ng Q S. A Flexible Virtual Structure Formation Keeping Control for Fixed-Wing UAVs[C]//IEEE Conference on Control Application, 2011:621-626 |
Click to display the text | |
[7] | Beard R W, Lawton J, Hadaegh F Y. A Feedback Architecture for Formation Control[J]. IEEE Trans on Control Systems Technology, 2001(11):777-790 |
Click to display the text | |
[8] | Low C B. A Trajectory Tracking Control Design for Fixed-Wing Unmanned Aerial Vehicles[C]//IEEE Conference on Control Application, 2010:2118-2123 |
Click to display the text | |
[9] | 韩京清.自抗扰控制技术[M].北京:国防工业出版社, 2009:119-206 Han Jingqing. Active Disturbance Rejection Control Technique[M]. Beijing, National Defense Industry Press, 2009:119-206. (in Chinese) |
[10] | 张日东,薛安克,李平,等.非线性预测控制及其工业应用[M].北京:科学出版社, 2012:8-18 Zhang Ridong, Xue Anke, Li Ping, et al. Nonlinear Predictive Control and Applications in Industry[M]. Beijing, Science Press, 2012:8-18(in Chinese) |
2. UAV Research Institute, Northwestern Polytechnical University, Xi'an 710065, China