自由漂浮空间机器人神经网络自适应控制律设计

Download PDF 打印本文

引用本文

朱战霞, 张红文, 罗秋月. 自由漂浮空间机器人神经网络自适应控制律设计[J]. 西北工业大学学报, 2017, 35(1): 59-65. 复制到剪切板

Zhu Zhanxia, Zhang Hongwen, Luo Qiuyue. Adaptive Neural Network Control for Free-Floating Space Robot[J]. Journal of Northwestern Polytechnical University, 2017, 35(1): 59-65. 复制到剪切板

自由漂浮空间机器人神经网络自适应控制律设计

朱战霞^1,2, 张红文^1,2, 罗秋月^1,2

1. 西北工业大学航天学院, 陕西西安 710072;
2. 航天飞行动力学技术国家级重点实验室, 陕西西安 710072

收稿日期: 2016-09-10

基金项目: 国家自然科学基金（11472213）资助

作者简介: 朱战霞 (1973-), 女, 西北工业大学教授、博士生导师, 主要从事飞行动力学与控制、空间操作地面实验方法研究。

摘要: 自由飘浮空间机器人是一种复杂的非线性系统，当考虑各种因素引起的模型不确定性和外部干扰时，传统控制已不能满足要求。为此，文章考虑不确定性干扰对系统的影响，基于神经网络在线建模技术，将系统误差和误差变化率作为状态量，利用李雅普诺夫方程设计网络权值变化率，通过训练权值对不确定部分进行逼近，在此基础上设计神经网络自适应控制项，用于修正基于名义模型的控制律，补偿不确定项造成的控制误差，并证明了控制系统的稳定性。7关节空间机器人的数值仿真结果表明，文中所设计的自适应神经网络控制器，在机械臂末端有干扰和负载的情况下，也能向期望轨迹靠拢，并在一定误差范围内保持收敛，相比于传统PID控制器，性能更优。

关键词: 控制器李雅普诺夫函数非线性分析

自由飘浮空间机器人系统不仅自由度多, 而且各关节运动与飘浮基座之间相互干扰、关节运动存在摩擦、外界存在干扰等, 因此属于一类非线性不确定性系统^[1], 致使传统的PID控制无法满足机器人精细操作的要求。为此, 有必要研究更加符合自由飘浮空间机器人系统特性的先进控制方法。

智能控制方法已经在非线性不确定性系统中得到了广泛应用, 也有不少学者将智能方法应用于空间机器人的控制中^[2-3]。Newton等设计了一种神经网络实时在线学习控制方法, 通过学习训练来调整神经网络的权值以及阈值, 修正机器人的前馈动力学模型, 使系统的实际输出越来越接近目标输出。Feng等^[4]提出了一种鲁棒神经网络控制方法, 利用径向基神经网络对系统参数进行在线调整以补偿模型的不确定项, 但当模型中自由度较多时, 系统矩阵维数增加, 导致运算量增大计算耗时较长。Sanner等^[5]结合神经网络控制与变结构控制的优点, 设计了机器人神经网络滑模控制方法, 并对其稳定性进行了证明。郭益深和陈力^[6-7]设计了径向基神经元网络的关节运动自适应控制算法, 无需线性化动力学方程。封保民等^[8]基于径向基神经网络设计了自由漂浮空间机器人在任务空间中的轨迹跟踪控制器, 提出了基于耗散理论的鲁棒控制器, 用于抑制跟踪累积误差和参数不确定的影响, 避免了对动力学模型参数线性化的要求, 但其径向基神经网络各参数的初始值是通过对系统的标称模型进行粗略学习之后得到的, 影响系统实时性。

虽然大多文献都考虑了参数的不确定性, 但对于实际运行过程中的非参数不确定性 (如关节的摩擦或因目标的捕获而改变末端负载的情况) 影响还有待深入研究。为此, 本文基于工作空间中的机器人模型, 考虑不确定性干扰对系统的影响, 基于神经网络在线建模技术, 提出并设计了自适应神经网络控制算法。

1 工作空间中机器人动力学模型

空间机器人具有一定的工作空间, 只有当目标进入机械臂的可达工作空间后, 机械臂才开始按期望的路径运动, 并进行相应操作。因此, 直接在工作空间中设计控制算法更符合工程实际。

一般地, 空间机器人运动学方程可以写为

(1)

式中，, v_e为末端线速度、ω_e为末端角速度, J_g为广义雅克比矩阵。

将空间机器人的运动学方程对时间求导可以得到机械臂末端状态向量对时间的二阶导表达式

(2)

空间机器人关节空间的动力学方程为

(3)

式中，τ为关节力矩, 为包含离心力与哥氏力的非线性项, 其表达式为

(4)

H(q) 为对称正定的惯性矩阵, 其表达式为

(5)

式中，H_b为基座惯性矩阵, H_bm为基座与空间机械臂之间的耦合惯量矩阵, H_m表示空间机械臂基座坐标系与惯性坐标系重合时 (即基座固定于地面时) 机械臂的惯性矩阵。

给 (3) 式左乘J_g^-T, 并将 (2) 式带入, 可以得到空间机器人在工作空间中的动力学方程

(6)

式中

与关节空间类似, 工作空间动力学方程各项参数具有以下特性:

1) 惯性矩阵H_x(q) 对称, 正定且有界;

2) 矩阵斜对称。

若考虑外部干扰, 则 (6) 式变为

(7)

式中, f_dist代表外部干扰力和力矩。

2 基于名义模型的控制律设计

假设x_ed是x_e的期望状态, 则空间机器人系统误差可以定义为e=x_e-x_ed, 误差变化率为为期望状态的一阶导数, 为期望状态的二阶导数。对于 (6) 式所述的系统, 若不考虑各种干扰和不确定性对系统模型的影响, 即H_x(q), 可以精确得到, 则可以通过设计合适的PD控制律, 使系统误差收敛, 并满足以下误差方程。

(8)

式中，K_p、K_v为比例微分控制律中的增益矩阵。

则由 (8) 式得

(9)

带入 (6) 式得

(10)

(10) 式即为模型精确时所设计的控制器。

3 模型不确定性的影响

然而实际系统存在许多不确定因素, 如关节低速运动时受到的摩擦力, 或燃料消耗引起的质量变化等。这些不确定因素会导致无法精确得到实际模型, 即无法得到精确的H_x(q) 和, 因此只能建立理想的名义模型。

若采用空间机器人各项动力学参数的估计值代替其精确值, 得到的模型称之为名义模型。这里以H_x0(q) 表示名义模型的惯量矩阵, 以表示名义模型的哥氏力、离心力项, 则针对名义模型的控制器为

(11)

考虑外部干扰力和力矩, 将 (11) 式代入 (7) 式, 可以得到

(12)

令, 可将 (12) 式变换为

(13)

比较 (13) 式和 (7) 式可见, 若名义模型与系统精确模型存在误差, 即ΔH、ΔC不为零, 则 (13) 式右端不等于零, 模型不精确会影响系统的性能。因此, 需要采取一定的方法对模型中存在的不精确部分进行逼近, 使其与实际系统一致。

4 自适应神经网络控制器设计

径向基神经网络具有局部逼近特性, 因此本文采用径向基神经网络对模型的不精确部分进行逼近。

径向基神经网络结构如图 1所示, 它具有3层前馈网络, 即输入层、隐含层和输出层。信号由输入层传递至各隐含层节点, 经隐含层的映射函数处理后经过加权传递至输出层, 其中x₁, x₂, …, x_n为输入信号, y₁, y₂, …, y_n为输出信号。

图 1 径向基神经网络结构示意图

图选项

一般地, 隐含层中的作用函数可以采用如下的高斯函数

(14)

式中, c_i为中心向量, 反映了第i个高斯基函数的映射范围。b_i为宽度向量, 反映了第i个高斯基函数的灵敏度。φ_i为第i个高斯函数的输出。

若再定义神经网络权值为

则径向基神经网络的输出为

(15)

式中。

4.1 控制器设计

令 (13) 式中等号右边的项为模型的不精确部分f(x), 则

(16)

采用径向基神经网络对不确定部分f(x) 进行逼近时, 设最优权值为W^*, 基函数中心矢量最优值为c^*, 基函数宽度最优值为b^*, 令w^*=1/b^*, 则神经网络的理想逼近为

(17)

式中, , 逼近误差为ε。

根据神经网络的逼近能力, 假设:

假设1 最优权值及网络参数W^*、c^*、w^*均有界, 即存在正常数, 满足‖W^*‖≤W_M, ‖c^*‖≤c_M, ‖w^*‖≤w_M。

假设2 对任意一个给定的正数ε_M, 总能找到最优权值及网络参数W^*、c^*、w^*, 使得神经网络的逼近误差ε满足。

设为神经网络控制器对不确定部分f的估计输出。即

(18)

式中，是权值的估计值。

定义, 则

(19)

则神经网络的建模误差为

(20)

基于对不确定部分f的估计输出, 设计神经网络自适应控制器为

(21)

(21) 式是考虑不确定项影响之后的补偿控制项, 结合 (11) 式, 系统控制律设计为

(22)

式中，F_x为针对名义模型设计的控制项, F_NN为神经网络自适应补偿控制项。控制系统结构图如图 2所示。

图 2 控制系统结构图

图选项

将 (22) 式代入 (7) 式, 可以得到

(23)

等式两边分别减去, 可以得到

(24)

于是有

(25)

利用 (16) 式、(25) 式可以写为

(26)

取状态量, 则上式可以写为

(27)

式中

相应系统的李雅普诺夫方程为

(28)

由 (28) 式可知, 若给定Q正定, 则系统稳定。此时对称正定矩阵P=lyap (A^T, Q)。

基于以上误差方程和李雅普诺夫方程, 设计网络权值估计值的变化率为

(29)

式中γ＞0, β＞0。

则网络权值估计值可以通过对 (29) 式积分得到

(30)

于是神经网络自适应控制项的具体表达式为

(31)

4.2 稳定性分析

由于

(32)

式中。

因此状态方程可以写作

(33)

定义李雅普诺夫函数为

(34)

由于

则

(35)

把 (29) 式代入上式可得

(36)

设q_min和p_max分别为矩阵Q的最小特征值和P最大特征值, 并利用假设1, 可以得到

(37)

当满足条件

(38)

时, 得到收敛条件

(39)

因此, 只要选择合适的参数, 使其满足 (39) 式的收敛条件, 则有≤0, 系统稳定。

5 数值仿真

为了验证本文方法的有效性, 以自由漂浮7关节空间机器人为对象进行仿真。机械臂构型参考加拿大二号机械臂, 如图 3所示。

图 3 7关节机械臂构型

图选项

选取基座质心初始时刻的位置为惯性参考系O_{_I-x_Iy_Iz_I}的原点, 基座的连体坐标系O_{₀-x₀y₀z₀}原点O₀取在基座质心处, 坐标轴与其惯量主轴方向一致。假定初始状态下基座的连体坐标系和惯性坐标系是重合的。系统的物理参数如表 1所示, 机械臂的Denavit-Hartenberg参数如表 2所示。

表 1 空间机器人系统参数

编号	质量 /kg	长度 /m	主惯量矩
编号	质量 /kg	长度 /m	I_xx /(kg·m²)	I_yy /(kg·m²)	I_zz /(kg·m²)
0	5 000	6	3 000	6 000	4 000
1	20	0.35	2	2	3
2	20	0.35	2	2	3
3	40	4	1	40	40
4	40	4	1	40	40
5	20	0.35	2	2	3
6	20	0.35	2	2	3
7	40	1.2	10	8	4

表选项

表 2 机械臂的Denavit-Hartenberg参数

a_i-1/m	a_i-1/(°)	a_i/m	q_i/(°)
0	0	4.2	q₁
0	90	0.35	q₂
0	90	0.35	q₃
4	0	0	q₄
4	0	0.35	q₅
0	90	0.35	q₆
0	90	1.2	q₇

表选项

系统初始条件如下, 各关节初始角度、角速度、机器人基座位置均为零, 机器人基座初始姿态ω₀为

末端执行器的初始位置p_e0和初始姿态ω_e0分别为

末端执行器期望的位置和速度为

假设系统中只有前3个关节有扰动, 其余关节扰动为零, 取:

并假设在t=10 s时机械臂抓捕上目标体, 目标体质量随时间变化规律未知。在仿真中仅考虑对机械臂末端位置的控制, 忽略角度的控制, 控制参数取

取神经网络中心矢量和基函数宽度分别为

采用本文所设计的自适应神经网络控制算法, 仿真得到机械臂末端对期望轨迹的跟踪曲线如图 4所示。

图 4 神经网络控制下的轨迹跟踪

图选项

为了对比, 也采用传统PID控制进行了仿真, 轨迹跟踪曲线如图 5所示。机械臂末端执行器对期望轨迹的跟踪误差如图 6~图 8所示。

图 5 PID控制下的轨迹跟踪

图选项

图 6 机械臂对期望轨迹的跟踪误差 (x方向)

图选项

图 7 机械臂对期望轨迹的跟踪误差 (y方向)

图选项

图 8 机械臂对期望轨迹的跟踪误差 (z方向)

图选项

由以上曲线可以看出, PID控制和自适应神经网络控制在开始阶段时, 都能够使位置跟踪误差逐渐收敛至零。但在第10 s第7关节质量突变后 (抓取目标后), PID控制由于缺乏鲁棒性, 位置跟踪误差出现波动且呈发散趋势。而自适应神经网络控制位置误差尽管在第10 s时有一个小的波动, 但是, 经过短暂的调节, 依然能够保持收敛。可见, 即使在有未知扰动的影响下, 神经网络的学习能力能够使系统依然跟踪上期望轨迹。

6 结论

本文针对自由漂浮空间机器人存在模型不确定性和外界干扰的情形, 在工作空间中设计了自适应神经网络控制器。该控制器利用径向基神经网络对模型中的未知项进行逼近, 并结合系统误差和误差变化率给出了基于李雅普诺夫方程的权值及网络参数调整律。仿真结果表明本文设计的自适应神经网络控制器, 在机械臂末端有干扰和负载的情况下, 也能向期望轨迹靠拢, 并在一定误差范围内保持收敛, 相比于传统PID控制器, 性能更优。

参考文献

[1]	Yoshida K, Nenchev D, Ishigami G, et al. Space Robotics[M]. The International Handbook of Space Technology, Springer Berlin Heidelberg, 2014:541-573

[2]	Flores-Abad A, Ma O, Pham K, et al. A Review of Space Robotics Technologies for On-Orbit Servicing[J]. Progress in Aerospace Sciences, 2014, 68(8): 1–26.

[3]	Newton R Todd, Xu Yangsheng. Neural Network Control of a Space Manipulator[J]. IEEE Control Systems, 1993, 13(6): 14–22. DOI:10.1109/37.247999

[4]	Feng B, Ma G, Xie W, et al. Robust Tracking Control of Space Robot via Neural Network[C]//20061st International Symposium on Systems and Control in Aerospace and Astronautics, 2006:902-906

[5]	Sanner R M, Slotine J J E. Stable Adaptive Control of Robot Manipulators Using "Neural" Networks[J]. Neural Computation, 1995, 7(4): 753–790. DOI:10.1162/neco.1995.7.4.753

[6]	郭益深, 陈力. 漂浮基姿态受控空间机械臂关节运动的自适应神经网络控制[J]. 空间科学学报, 2008, 28 (2): 173–179. Guo Yishen, Chen Li. Adaptive Neural Network Control of Free-Floating Space Manipulator with an Attitude Control Base[J]. Chinese Journal of Space Science, 2008, 28(2): 173–179. (in Chinese)

[7]	陈力. 参数不确定空间机械臂系统的鲁棒自适应混合控制[J]. 控制理论与应用, 2004, 21 (4): 512–516. Chen Li. Robust and Adaptive Composite Control of Space Manipulator System with Uncertain Parameters[J]. Control Theory & Applications, 2004, 21(4): 512–516. (in Chinese)

[8]	丰保民.自由漂浮空间机器人轨迹规划与轨迹跟踪问题研究[D].哈尔滨:哈尔滨工业大学, 2007 Feng Baomin. Study on Path Planning and Trajectory Tracking Control of Free-Floating Space Robot[D]. Harbin, Harbin Institute of Technology, 2007(in Chinese)

Adaptive Neural Network Control for Free-Floating Space Robot

Zhu Zhanxia^1,2, Zhang Hongwen^1,2, Luo Qiuyue^1,2

1. School of Astronautics, Northwestern Polytechnical University, Xi'an 710072, China;
2. National Key Laboratory of Aerospace Flight Dynamics, Xi'an 710072, China

Abstract: Free-floating space robot system is a very complicated nonlinear analysis. Traditional control strategy cannot meet the technical requirements when considering uncertain terms and external disturbances. For this reason, the influence of the uncertainty to the system is considered in this article. This article regard the control error and the error rate as system state. Basing on neural network on-line modeling technique, design the change rate of network weights and approach the uncertain parts by weight of training. Then design adaptive neural network control item, which can be used to amend nominal-model-based control and compensate the control error caused by uncertain terms. Meanwhile, The stability of control system is proved. The numerical simulation of 7 DOF (degree of freedom) space robot show that with the adaptive neural network controller proposed in this article, the end-effector with disturbances and load can also close to the desired trajectory and converge when the error within a finite range. The controller performs better than traditional PID controller.

Key words: controllers Lyapunov functions nonlinear analysis

西北工业大学主办。

文章信息

朱战霞, 张红文, 罗秋月

Zhu Zhanxia, Zhang Hongwen, Luo Qiuyue

自由漂浮空间机器人神经网络自适应控制律设计

Adaptive Neural Network Control for Free-Floating Space Robot

西北工业大学学报, 2017, 35(1): 59-65.

Journal of Northwestern Polytechnical University, 2017, 35(1): 59-65.

文章历史

收稿日期: 2016-09-10

文章信息

文章历史

相关文章

工作空间