基于RBF神经网络的自主水下航行器模型预测路径跟踪控制
郭琳钰1, 高剑1, 焦慧锋2,3, 宋允轩1, 陈依民1, 潘光1     
1. 西北工业大学 航海学院, 陕西 西安 710072;
2. 西北工业大学 无人系统技术研究院, 陕西 西安 710072;
3. 中国船舶科学研究中心, 江苏 无锡 214082
摘要: 针对自主水下航行器(AUV)的模型不确定性和多约束的特点, 设计了基于径向基(RBF)神经网络的模型预测控制器。在使用模型预测控制(MPC)进行路径跟踪控制的基础上, 利用实时测量数据在线训练RBF神经网络, 对AUV模型不确定性进行补偿, 抑制了模型不确定性对模型预测控制器的干扰, 减小了系统的超调量和跟踪误差。仿真结果表明, 基于RBF-MPC路径跟踪控制算法与经典的MPC算法相比, 具有更好的暂态和稳态性能。
关键词: 自主水下航行器    模型预测控制    径向基神经网络    路径跟踪控制    

自主水下航行(AUV)因其航程远、作业精准度高、可重复使用等特点,成为了人类认识和探索海洋领域必不可缺的工具,在近些年逐渐被广泛应用。精确路径跟踪控制是AUV实现自主航行的关键技术之一,受到国内外学者的广泛关注。

在路径跟踪控制问题上,早期的运动控制方法为比例-积分-微分(PID)控制,文献[1]使用PID控制器实现了路径跟踪,并通过大量的海上实验证明了该控制器的鲁棒性和稳定性。

水下航行器多为欠驱动、强耦合的非线性系统,并受到未建模动态和环境扰动的影响。为提高水下航行器运动控制面对多种不确定因素的鲁棒性,研究人员提出了基于自适应控制[2-4]、滑模控制[5-6]、反步控制[7-8]、神经网络控制[9-10]等路径跟踪控制方案。

Gao等[11]研究了水平面AUV非线性路径跟踪控制问题。以路径上自由参考点为起点的Serret-Frenet坐标来描述路径跟踪误差及其动态方程,解决了经典方法中的奇异性问题。Sun等[12]基于改进的反步法和滑模控制原理,研究了考虑未知环境干扰下的欠驱动水下航行器的路径跟踪控制问题。通过数值仿真验证了滤波反步滑模控制器的控制效果。与传统的反步滑模控制器相比,控制器输出的抖振明显减小,跟踪误差收敛更快,达到稳定跟踪状态所需的时间更短,稳定性更高。然而,AUV水下作业环境复杂,需要考虑各种约束条件,上述控制器难以处理约束问题。

模型预测控制(MPC)是一种基于模型的闭环优化控制策略,相对于传统控制方法的优势在于能够在控制器设计范围内系统地处理带约束条件的多输入多输出问题,目前己经成为了自动控制领域的主流研究方向之一。

在AUV的路径跟踪控制方面,模型预测控制发挥着重要作用。文献[13]考虑了有输入约束条件下的欠驱动AUV直线路径跟踪问题,提出了基于MPC的AUV路径跟踪控制器,并比较了线性预测模型、时变线性预测模型和非线性预测模型的方案,结果表明3种方案均具有良好的跟踪性能和鲁棒性。文献[14]针对含障碍物的受限工作空间,提出了一种新型非线性模型预测控制方案,引导AUV朝着特定方向前进,并在控制器设计中考虑了各种约束条件(如:障碍物位置、工作空间边界、推进器饱和速度限制等)。Shen等[15]针对AUV轨迹跟踪问题提出了基于李雅普诺夫稳定性的模型预测控制(LMPC)框架,在LMPC框架中考虑了驱动器饱和、推力分配等实际性的约束问题。Gao等[16]针对全驱动水下航行器的视角约束、执行器约束和模型不确定性,提出了一种基于滑动模态观测器的模型预测控制策略。刘昌鑫等[17]针对欠驱动AUV的约束路径跟踪问题,设计了一种MPC路径跟踪控制器,采用REMUS AUV的模型参数对提出的控制律进行了仿真研究,实验结果表明控制器在显式处理约束的同时,表现出良好的跟踪效果。在文献[15]的基础上,Shen等[18]研究了AUV的路径跟踪问题,将路径跟踪作为首要任务优先完成,提出了一种新的多目标模型预测控制框架。

MPC控制策略能处理多输入多输出并带约束的复杂系统,且具有较强的可靠性和鲁棒性。MPC优异的控制效果依赖于精确的模型,但是AUV模型具有多自由度、非线性、强耦合性的特点,而且AUV运动数学模型中的部分水动力附加质量、惯性矩和阻尼系数是难以精确建模的。另外,AUV在航行过程中,经常会受到外界(如:未知深层流和表面流)的干扰,上述特点使得AUV路径跟踪控制增添了许多不确定性。

径向基(RBF)神经网络能快速逼近系统动力学模型,结构更简单,与其他神经网络算法相比,RBF神经网络在解决实时函数逼近问题上有一定的优势。因此,本文针对AUV的模型不确定性引入RBF神经网络算法,通过提升预测模型的精度进而优化路径跟踪控制效果。

1 欠驱动AUV数学模型

针对AUV的路径跟踪控制问题,首要工作是建立AUV的数学模型。本文研究水平面上的欠驱动AUV路径跟踪控制问题,为了方便后续的研究分析,忽略欠驱动AUV水平面运动和垂直面运动带来的耦合效应,忽略动力学模型中的非线性二次阻尼项,建立欠驱动AUV的水平面三自由度运动方程。

通常使用2个坐标系来描述AUV的运动(如图 1所示): 地面坐标系和运载体坐标系。地面坐标系的原点O固定在地球上一处, 规定OX向北为正, OY向东为正。运载体坐标系的原点OB选择在AUV的浮心, 规定OBXB沿着AUV的纵轴并指向艏向, OBYB与之垂直, 向右为正。

图 1 AUV水平面坐标系

x表示前向位移, y表示侧向位移, ψ表示航向角, vxvy分别为前向速度和侧向速度, r为AUV的航向角速度, 定义广义坐标向量η=, 广义速度向量, 以此得到AUV在水平面上的运动方程为

(1)
(2)

式中: M为含附加质量的惯性矩阵; C(v)为哥氏力和向心力矩阵; D(v)为阻尼矩阵; τ是在3个自由度上的输入力、推进器产生的推力以及操纵面产生的操纵力。

在(1)~(2)式中, AUV的质量、水动力附加质量、惯性矩和阻尼系数等通常随工作条件(包括任务和环境)的变化而变化, 在实践中难以确定。此外, 海洋环境扰动往往是不可预测的、多变的。因此, AUV的运动数学模型受到诸多不确定因素的影响。

假设AUV的纵剖面、横剖面分别对称, 有

(3)
(4)
(5)
(6)

式中:为航行器的附加质量系数;Xu|u|, Yv|v|, Nr|r|为阻尼力系数。

由此可得, 欠驱动AUV在水平面上的运动学方程和动力学方程, 分别表示为

(7)

(8)

式中: m11=M11, m22=M22, m33=M33, d11=D11, d22=D22, d33=D33

2 RBF-MPC路径跟踪控制器设计

令向量x表示AUV的状态, u表示控制输入, 则AUV的状态更新方程描述为

(9)

式中:状态, vx表示航行器的前向速度;vy表示侧向速度;r表示航向角速度;x表示前向位移;y表示侧向位移;ψ表示航向角; 控制输入X表示前向推力;N表示转向力矩。

由于AUV模型中参数的不确定性, 令Δf(xk, uk)表示AUV模型中的不确定项, fnom(xk, uk)表示名义模型, 则真实系统ftrue(xk, uk)表示为

(10)

因此可以将AUV路径跟踪控制问题描述为以下带约束的动态优化问题

(11)

满足

(12)
(13)
(14)
(15)

式中: RQ分别为路径跟踪状态偏差的权重矩阵和控制输入权重矩阵, (12)式表示不断更新的AUV模型; (13)式中xk+1表示补偿后模型的6个状态; xref是参考状态; u为控制输入力X和力矩N; (15)式中模型预测的初始状态x0为真实系统的当前状态xk反馈。

MPC控制器在AUV进行路径跟踪时通过传感器获得当前时刻的AUV状态值; 然后根据预测模型对AUV在预测时域内的状态值进行预测, 通过构建目标函数(11)式并结合约束条件(12)式和(14)式优化求解预测时域内的控制序列; 最后选取求解得到控制序列的第一个元素作为系统的控制输入。这一时刻结束后在下一个采样时刻重新获取AUV的状态, 继续下一周期的滚动优化。

在实际航行过程中, AUV的结构参数经常发生变化。除此之外, 由于水下航行器系统的强非线性和强耦合性, 也导致AUV实际上难以建立精确的实际系统模型, 影响了其跟踪的预设路径的精度。因此, 针对模型不确定项Δf(xk, uk), 采用RBF神经网络来进行逼近。

RBF网络结构如图 2所示, 该结构包括3个不同的层, 其中n是输入层节点的个数, m是隐藏层节点的个数, l是输出层节点的个数。

图 2 RBF网络原理图

该结构中第一层是输入层, 输入层X=[xi]T, 其目的是将n个输入分配给第二层隐藏层的m个节点, 隐藏层输出H=[hj]T, 其中xhj分别是系统输入和隐藏层的第j个输出, 本文选择高斯函数作为激活函数, 即

(16)

式中, ‖x-cj‖表示xcj之间的欧几里得距离, RBF神经网络采用中心cj和宽度σj为参数的高斯基函数。

RBF第三层输出层为网络的输出, 通过线性组合隐藏层来计算网络的预测输出, 从而有计算方式

(17)

式中, wjq是第j个隐藏层节点到第q个输出层节点的权重, 采用梯度下降法辨识wjq

结合(17)式, AUV模型不确定性可表示为

(18)

式中: W是隐藏层到输出层的权重矩阵; H是由(16)式计算得到的向量; ε是偏差项。权重矩阵WH分别为m×lm×1的矩阵, ml分别表示输入层、隐藏层和输出层的节点数量。

3 仿真实验与结果分析

在仿真实验中, 神经网络部分学习速率η=0.2, 动量因子α=0.05, 经过不同隐含层数对比分析, 网络结构选择为5-7-3, 即输入层节点有5个, 输入层为真实系统的状态, 隐藏层节点为7个, 输出层节点3个, 输出为Δf(xk, uk)。采用梯度下降法调整权重W, 使用神经网络的输出描述(12)式中的不确定项, 对AUV状态进行预测。基于RBF网络的MPC控制器框架如图 3所示。

图 3 RBF-MPC结构图

分别采用经典MPC控制方法和RBF-MPC控制方法进行路径跟踪控制, 对比2种方法对路径的跟踪效果, 其中轨迹偏差权重为[1.6  1.6], 控制增量权重为[5×10-2  6×10-2]。为了体现模型不确定性, 分别选取理想模型与实际模型参数如表 1所示。

表 1 模型参数表
参数名 理想模型 实际模型
m 30.47 33.47
Ixx 1.77 1.97
Iyy 3.45 4.05
0.93 1.23
35.50 37.50
4.88 4.88
3.1 波形曲线跟踪结果分析

为验证基于RBF-MPC的路径跟踪控制方法的有效性, 先将参考路径选择为波形图进行测试, 波形表达式选择为

(19)

式中:xl为目标横坐标;yl为目标纵坐标。

AUV的初始位置为(0 m, 0 m), 初始航向角为0 rad, 控制器的采样间隔为T=0.1, 预测步长为N=50, 仿真时间为150 s。跟踪波形的仿真结果如图 4~6所示。

图 4 波形跟踪控制结果
图 5 x方向跟踪误差对比
图 6 y方向跟踪误差对比

图 4可以明显看出, 采用RBF神经网络的MPC控制器明显误差更小一些, 在横向100 m以内即可跟踪上波形, 不仅收敛速度更快, 而且横纵位置的偏差更小; 而MPC控制器在横坐标大约为180 m处才能在一定误差内跟踪上波形。

为进一步清晰看出MPC控制器和RBF-MPC控制器的跟踪效果差异, 将横纵向位置的跟踪偏差结果展示在图 5~6。MPC控制器在x方向达到稳态的时间大致为72 s, 位置偏差最高可达26.0 m; 而RBF-MPC控制器x方向达到稳态时间缩短为大约50 s, 位置偏差减少到13.0 m, 位置误差减少大约50%。因此, 在控制器参数、AUV模型和初始状态等其他条件均相同的情况下, RBF-MPC控制器收敛速度更快, 超调量更小。

图 7~8展示了使用MPC控制器和RBF-MPC控制器跟踪正弦波时, 控制输入力和力矩的变化。

图 7 控制输入力的变化曲线
图 8 控制输入力矩的变化曲线

从变化趋势上来看, RBF-MPC控制器产生的输入波动更小, 特别在30, 59, 70 s峰值处差异较为明显, 且在稳态阶段, RBF-MPC控制器得到的控制输入比较平稳。

采用2种控制器跟踪正弦波形, 验证了本文提出的RBF-MPC控制器的可行性。该控制器能够有效减小模型不确定性带来的扰动, 减小系统的超调和稳态误差。

3.2 参考路径仿真结果分析

设置AUV初始位置为(10 m, -10 m), 依次到达目标点位置为(17 m, -56 m), (187 m, -146 m), (208 m, -234 m), (334 m, -414 m), (488 m, -488 m), (980 m, -980 m), 初始航向角0, 控制器的采样间隔T=0.1, 预测步长N=50, 仿真时间为360 s。

图 9可以看出, 2种控制器都能较好地完成跟踪任务, 从局部放大图可以看出, 2种控制器都能产生平滑的运动轨迹, 但是在转向点处, 二者的差异非常明显。不论是在横坐标为30~80 m的第一次拐角路径跟踪段, 还是在横坐标为350~400 m的第二次拐角处路径跟踪段, RBF-MPC控制器都比MPC控制器具有更小的超调量, 能更快速地减少与期望的参考路径之间误差, 具有更好的跟踪性能。

图 9 路径跟踪控制结果

为进一步清晰看出MPC控制器和RBF-MPC控制器的跟踪效果差异, 将横纵向位置的跟踪偏差结果展示在图 10~11

图 10 x方向跟踪误差对比
图 11 y方向跟踪误差对比

MPC控制器在x方向的位置偏差最高可达15.5 m, 而RBF-MPC控制器可以将误差减少到6.9 m, 误差减少将近50%, 在y方向的位置误差上RBF-MPC控制器的优势也很显著, 特别是在第18 s到第75 s之间。因此, 可以看出模型不确定性使MPC控制器存在较大的稳态误差, 加入神经网络补偿后, 超调量明显减少, 更快达到稳定状态。

图 12~13展示了使用MPC控制器和RBF-MPC控制器时, 控制输入力和力矩的变化。从变化趋势上来看, RBF-MPC控制器产生的输入波动更小, 特别在10, 59, 66 s峰值处差异较为明显, 且在稳态阶段, RBF-MPC控制器得到的控制输入比较平稳, 所耗能量更少, 更利于AUV长时间水下作业。

图 12 控制输入力的变化曲线
图 13 控制输入力矩的变化曲线

综上所述, 在存在模型不确定和扰动的情况下, RBF-MPC在控制效果方面具有更小的路径跟踪超调量和更小的稳态误差; 在控制输入方面, 具有更小输入幅值, 更加节能。与传统的MPC控制器相比, 综合优势明显。

4 结论

本文中, 针对AUV的路径跟踪控制问题, 提出了基于RBF神经网络的模型预测控制器, 使用RBF神经网络补偿AUV模型不确定性。仿真结果表明, 在模型存在建模误差和显著不确定性的情况下, RBF-MPC控制器可以将跟踪误差减少到6.9 m, 误差减少将近50%;加入神经网络补偿后, 超调量明显减少, 更快达到稳定状态。而且RBF-MPC控制器得到的控制输入比较平稳, 所耗能量更少。综合比较, RBF-MPC控制器具有更好的跟踪性能。

参考文献
[1] JALALYING B. The NDRE-AUV flight control system[J]. IEEE Journal of Oceanic Engineering, 1994, 19(4): 497-501. DOI:10.1109/48.338385
[2] REZAZADEGAN F, SHOJAEI K, SHEIKHOLEALAM F, et al. A novel approach to 6-DOF adaptive trajectory tracking control of an AUV in the presence of parameter uncertainties[J]. Ocean Engineering, 2015, 107: 246-258. DOI:10.1016/j.oceaneng.2015.07.040
[3] MAALOOF D, CHEMORI A, CREUZE V, et al. L-1 adaptive depth and pitch control of an underwater vehicle with real-time experiments[J]. Ocean Engineering, 2015, 98: 66-77. DOI:10.1016/j.oceaneng.2015.02.002
[4] DO K D. Robust adaptive tracking control of underactuated ODINs under stochastic sea loads[J]. Robotics & Autonomous Systems, 2015, 72: 152-163.
[5] GAO X, LIN H, WANG Y, et al. Application of robust optimal sliding mode control for underactuated AUV system with uncertainties[C]//2020 Chinese Control and Decision Conference, Hefei, 2020: 245-250
[6] WANG F, GUO C, YU H, et al. Three-dimensional path following of underactuated AUV based on nonsingular terminal sliding mode control[C]//2020 5th International Conference on Automation, Control and Robotics Engineering, Dalian, 2020: 346-350
[7] HU Y, YU J, YU H, et al. Adaptive fuzzy command filtered control with error compensation mechanism for AUVs via backstepping[C]//2018 Chinese Control and Decision Conference, Shenyang, 2018: 1226-1230
[8] CERVANTES J, YU W, SALAZAR S, et al. Output based backstepping control for trajectory tracking of an autonomous underwater vehicle[C]//2016 American Control Conference, Boston, 2016: 6423-6428
[9] WANG Y, ZHANG M, WILSON P, et al. Adaptive neural network-based backstepping fault tolerant control for underwater vehicles with thruster fault[J]. Ocean Engineering, 2015, 110(1): 15-24.
[10] CUI J, ZHAO L, YU J, et al. Neural network-based adaptive finite-time consensus tracking control for multiple autonomous underwater vehicles[J]. IEEE Access, 2019, 7: 33064-33074. DOI:10.1109/ACCESS.2019.2903833
[11] GAO J, YAN W, ZHAO N, et al. Global path following control for unmanned underwater vehicles[C]//Proceedings of the 29th Chinese Control Conference, Beijing, 2010: 3188-3192
[12] SUN Y, ZHANG C, XU H, et al. Three-dimensional path tracking control of the underactuated AIUV based on backstepping sliding mode[C]//2019 4th Asia-Pacific Conference on Intelligent Robot Systems, Nagoya, 2019: 95-103
[13] 张广洁, 严卫生, 高剑. 基于模型预测控制的欠驱动AUV直线路径跟踪[J]. 水下无人系统学报, 2017, 25(2): 82-88.
ZHANG Guangjie, YAN Weisheng, GAO Jian. Underactuated AUV linear path following based on model predictive control[J]. Journal of Underwater Unmanned System, 2017, 25(2): 82-88. (in Chinese)
[14] HESHMATI S, KARRAS G C, MARANTOS P, et al. A robust model predictive control approach for autonomous underwater vehicles operating in a constrained workspace[C]//2018 IEEE International Conference on Robotics and Automation, Brisbane, 2018: 6183-6188
[15] SHEN C, SHI Y, BUCKHAM B. Trajectory tracking control of an autonomous underwater vehicle using Lyapunov-based model predictive control[J]. IEEE Trans on Industrial Electronics, 2017, 65(7): 5796-5805.
[16] GAO J, ZHANG G, WU P, et al. Model predictive visual serving of fully-actuated underwater vehicles with a sliding mode disturbance observer[J]. IEEE Access, 2019, 7: 25516-25526. DOI:10.1109/ACCESS.2019.2900998
[17] 刘昌鑫, 高剑, 徐德民. 一种欠驱动AUV模型预测路径跟踪控制方法[J]. 机械科学与技术, 2017, 36(11): 1653-1657.
LIU Changxin, GAO Jian, XU Demin. A predictive path following method based on underactuated AUV model[J]. Mechanical Science and Technology, 2017, 36(11): 1653-1657. (in Chinese)
[18] SHEN C, SHI Y, BUCKHAM B. Path-following control of an AUV: a multi-objective model predictive control approach[J]. IEEE Trans on Control Systems Technology, 2019, 27(3): 1334-1342. DOI:10.1109/TCST.2018.2789440
Model predictive path following control of underwater vehicle based on RBF neural network
GUO Linyu1, GAO Jian1, JIAO Huifeng2,3, SONG Yunxuan1, CHEN Yimin1, PAN Guang1     
1. School of Marine Science and Technology, Northwestern Polytechnical University, Xi'an 710072, China;
2. Unmanned System Research Institute, Northwestern Polytechnical University, Xi'an 710072, China;
3. China Ship Scientific Research Center, Wuxi 214082, China
Abstract: A model prediction controller (MPC) based on radial basis function (RBF) neural network is designed to counter the model uncertainty and multiple constraints of the autonomous underwater vehicle (AUV). On this basis of path following control with MPC, the RBF neural network is trained online with real-time measurement data to compensate for the AUV's model uncertainty, thus suppressing the interference of model uncertainty on the MPC and reducing its overshoot and tracking error. Simulation results show that the path following algorithm based on RBF-MPC has better transient and steady-state performance compared with the classical MPC algorithm.
Keywords: autonomous underwater vehicle    model predictive control    radial basis function neural network    path following    
西北工业大学主办。
0

文章信息

郭琳钰, 高剑, 焦慧锋, 宋允轩, 陈依民, 潘光
GUO Linyu, GAO Jian, JIAO Huifeng, SONG Yunxuan, CHEN Yimin, PAN Guang
基于RBF神经网络的自主水下航行器模型预测路径跟踪控制
Model predictive path following control of underwater vehicle based on RBF neural network
西北工业大学学报, 2023, 41(5): 871-877.
Journal of Northwestern Polytechnical University, 2023, 41(5): 871-877.

文章历史

收稿日期: 2022-07-13

相关文章

工作空间