基于加权模糊Petri网的无人机自主任务推理决策研究

Download PDF 打印本文

引用本文

谭雁英, 童明, 张艳宁, 祝小平. 基于加权模糊Petri网的无人机自主任务推理决策研究[J]. 西北工业大学学报, 2016, 34(6): 951-956. 复制到剪切板

Tan Yanying, Tong Ming, Zhang Yanning, Zhu Xiaoping. Reasoning and Decision Making for Autonomous UAVs Based on Weighted Fuzzy Petri Nets[J]. Journal of Northwestern Polytechnical University, 2016, 34(6): 951-956. 复制到剪切板

基于加权模糊Petri网的无人机自主任务推理决策研究

谭雁英¹, 童明², 张艳宁³, 祝小平⁴

1. 西北工业大学航天学院精确制导与控制研究所, 陕西西安 710072;
2. 中国人民解放军68128部队, 甘肃兰州 730000;
3. 西北工业大学计算机学院, 陕西西安 710129;
4. 西北工业大学无人机所, 陕西西安 710065

收稿日期: 2016-03-29

作者简介: 谭雁英(1967-), 女, 西北工业大学教授, 博士, 主要从事无人机自主飞行智能管理、任务规划及组合导航控制。

摘要: 围绕无人机搜索/攻击自主任务推理决策典型想定，针对无人机自主任务推理决策规则中存在的不同输入命题对结论的贡献和影响不同，对加权模糊Petri网（weighted fuzzy petri nets，WFPN）形式化推理算法进行了深入研究；设计了双机自主搜索/攻击任务推理决策规则集；为进一步适应上述想定下规则集中存在的多条规则的输出命题是相同的情形，对WFPN形式化推理算法进行了改进；应用分层的策略，采用改进的WFPN形式化推理算法和上述设计的规则集，仿真验证了双机搜索/攻击自主任务推理结果的合理性，并降低了推算过程中矩阵的维数。

关键词: 无人机自主加权模糊Petri网形式化推理分层策略决策

无人机的高度自主智能化和多机协同是适应未来复杂多变战场环境的关键, 这就要求无人机尽量减少人为干预和操控, 不断提高多机协同自主推理决策能力^[1]。

模糊Petri网形式化推理方法, 由于具有Petri网强大的建模能力以及由模型生成矩阵, 通过矩阵代数运算自动执行推理决策的优势^[2], 广泛应用于有人机、导弹、机器人及无人机等领域基于规则的故障诊断与推理决策中^[3-7], 而其在多无人机自主任务推理决策方面的应用还比较少。

本文针对多无人机自主搜索/攻击任务典型想定下推理决策规则中存在的不同输入命题对结论贡献不同的问题, 对加权模糊Petri网(WFPN)形式化推理方法进行了深入研究, 并为满足上述想定下存在的多条规则的输出命题是相同的情形, 对WFPN形式化推理方法进行了改进。

1 WFPN形式化推理算法及其改进 1.1 WFPN的定义^[8]

定义1 WFPN可以定义为一个10元组:

式中, P={p₁, p₂, p₃, …, p_m}为库所集。T={t₁, t₂, t₃, …, t_n}为变迁集。D={d₁, d₂, d₃, …, d_m}是命题的集合。I为输入矩阵, I=[δ_ij]_m×n(δ_ij∈[0, 1], i=1, 2, …, m; j=1, 2, …, n)表示p_i到t_j的输入关系及权值, 当p_i是t_j的输入库所时δ_ij=w_ij, 否则为0。O为输出矩阵, O=[γ_ij]_m×n(γ_ij∈[0, 1], i=1, 2, …, m; j=1, 2, …, n)表示t_j到p_i的输出关系及规则可信程度μ(t_j), 当p_i是t_j的输出库所时γ_ij=μ(t_j), 否则为0。α:P→[0, 1]为命题到实数[0, 1]的映射, α⁰=[α₁⁰, α₂⁰, …, α_m⁰]^T表示命题的初始置信度。α^k=[α₁^k, α₂^k, …, α_m^k]^T表示第k次推理后的命题置信度。β:P→D为库所到命题之间的映射。f:T→[0, 1]为变迁到实数[0, 1]的映射, f(t)=μ(μ∈[0, 1])为规则信度。Th:λ_i代表变迁t_i的阈值(λ_i∈(0, 1), i=1, 2, …, n), λ=[λ₁, λ₂, …, λ_n]为阈值向量。W：W={w₁, w₂, …, w_k}为规则的权值集合, w_i为输入命题d_i(i=1, 2, 3, …, k)的权系数, (仅当k=1时权值为1)。

1.2 加权模糊产生式规则的Petri网建模

加权模糊产生式规则包含许多“合取(∧)”或“析取(∨)”连接的命题, 将简单规则以及它们的相互组合的规则对应的加权模糊产生式结构归结为以下3种类型^[9]：

1) IFd₁(w₁) THENd_k(μ₁, λ₁)。w₁为输入命题的权值, 通常为实数1。令y=α₁·w₁，当y≥λ₁时，规则才能执行, 那么α_k=y·μ₁；

图 1 简单加权模糊Petri网结构及其变迁激活准则

图选项

2) IFd₁(w₁)∧d₂(w₂)∧…∧d_n(w_n) THEN d_k(μ₁, λ₁)。w_i(i=1, 2, 3, …, n)为规则中每个输入命题的权值, 表示规则中不同命题对同一结论的贡献和影响程度。通常且0 < w_i≤1。规则的组合输入命题置信度为。令·α_i，如果y≥λ₁, 规则才能执行, 那么α_k=y·μ₁;

图 2 合取式加权模糊Petri网结构及其变迁激活准则

图选项

3) IFd₁(w₁)∨d₂(w₂)∨…∨d_n(w_n) THEN d_k(μ₁, μ₂, …, μ_n, λ₁, λ₂, …, λ_n)输入命题的权系数w_i都为1。令y_i=α_i·w_i, 若每条规则中的前提置信度都满足y_i≥λ_i, 那么α_k=max (y₁·μ₁, y₂·μ₂, …, y_n·μ_n)。

图 3 析取式加权模糊Petri网结构及其变迁激活准则

图选项

1.3 WFPN形式化推理算法改进

文献[10]中WFPN形式化推理算法适用于产生式规则集中每条规则的输出命题是不相同的情形。为进一步适应无人机自主任务推理决策规则集中存在的多条规则的输出命题是相同的情形, 本文将“⊗”算子引入到WFPN形式化推理算法中, 对文献[10]的算法进行了改进, 具体说明如下:

1)算子的引入

(1)⊕^[10]:A⊖B=D, d_ij=max{a_ij, b_ij}, 其中A、B、D均为m×n维矩阵, i=1, 2, …, m; j=1, 2, …, n;

(2) ⊖^[10]:A⊖B=D, 如果a_ij≥b_ij, d_ij=a_ij; a_ij < b_ij, d_ij=0。其中A、B、D均为m×n维矩阵, i=1, 2, …, m; j=1, 2, …, n;

(3) ⊗:A⊗B=C, A、B、C分别为m×p、p×n、m×n的矩阵, , i=1, 2, …, m; k=1, 2, …, p; j=1, 2, …, n。

2)改进的推理算法

步骤1 令k=0, 对向量α⁰, 输入矩阵I, 输出矩阵0, 阈值向量λ进行初始化;

步骤2 计算已知客观事实条件下, 变迁的输入命题组合置信度ρ=I^T·α^k;

步骤3 计算σ=ρ⊖λ, 比较命题组合置信度ρ和变迁阈值向量λ, 判断能够使能的变迁;

步骤4 激发上一步判断出的使能变迁, 并计算τ=0⊗σ, 同时为变迁的输入输出库所传递新的状态值;

步骤5 计算α^k+1=α^k⊕[0⊗((I^T·α^k)⊖λ)], 通过得到的新的状态值, 更新整个库所集的状态值;

步骤6 若α^k+1≠α^k, 令k=k+1, 重复步骤2至步骤5;若α^k+1=α^k, 推理结束, 并输出α^k+1。

2 基于WFPN的双机自主搜索/攻击任务推理决策规则设计 2.1 双机自主任务决策典型想定

假设:在某一目标区域内有A、B两架无人机执行搜索/攻击任务, 任务存在优先级之分。若小组内A、B两架无人机在所负责区域同时跟踪到同一目标时, 那么A、B两架无人机将按照设计的产生式规则进行任务决策。考虑到A、B两机自主任务决策的应用需求, 产生式规则的输入命题包含, 攻击适合值(suitable value for attack, SVA):包括适合攻击(suitable attack, SA)、中等适合攻击(moderate suitable attack, MSA)、不适合攻击(not suitable attack, NSA), 即:X_SVA={SA, MSA, NSA}, X=A or B; 目标优先级(target priority, TP):存在高(high, H)、中(moderate, M)、低(low, L)之分, 即:TP={H, M, L}; 剩余燃油(fuel):包括充足(enough, E)、不充足(not enough, NE), 即:X_FUEL={E, NE}, X=A or B。

规则的输出命题包含:A攻击目标B继续搜索(A strike target and B continue search, A_ST B_CS)、A继续搜索B攻击目标(A_CS B_ST)、A继续搜索B继续搜索(A_CS B_CS)、A继续搜索B重新对准再次攻击(A continue search, B redirect and attack again, A_CSB_RAA)、A重新对准再次攻击B继续搜索(A_RAA B_CS)。

2.2 双机自主任务决策加权模糊产生式规则集设计

根据专家经验, 设计A、B两架无人机自主任务决策加权模糊产生式规则Rule1~Rule72如表 1所示。

表 1 A、B两机自主任务决策加权模糊产生式规则集设计列表

Rules	TP	ASVA	BSVA	AFUEL	BFUEL	Results
R1	H (0.2)	SA (0.3)	SA (0.1)	E (0.3)	E (0.1)	A_STB_CS
R2	H (0.2)	SA (0.1)	SA (0.3)	E (0.1)	NE (0.3)	A_CSB_ST
R3	H (0.2)	SA (0.3)	SA (0.1)	NE (0.3)	E (0, 1)	A_STB_CS
R4	H (0.2)	SA (0.3)	SA (0.1)	NE (0.3)	E (0, 1)	A_STB_CS
R5	H (0.2)	SA (0.5)	MSA (0.3)			A_STB_CS
R6	H (0.2)	SA (0.5)	NSA (0.3)			A_STB_CS
R7	H (0.2)	MSA (0.3)	SA (0.5)			A_CSB_ST
R8	H (0.2)	MSA (0.3)	MSA (0.1)	E (0.3)	E (0.1)	A_STB_CS
R9	H (0.2)	MSA (0.1)	MSA (0.3)	E (0.1)	NE (0.3)	A_CSB_ST
R10	H (0.2)	MSA (0.3)	MSA (0.1)	NE (0.3)	E (0.1)	A_STB_CS
︙
R63	L (0.2)	NSA (0.3)	SA (0.1)	NE (0.3)	N (0.1)	A_RAAB_CS
R64	L (0.2)	NSA (0.1)	SA (0.3)	NE (0.1)	NE (0.3)	A_CSB_ST
R65	L (0.2)	NSA (0.1)	MSA (0.1)	N (0.3)	N (0.3)	A_CSB_CS
R66	L (0.2)	NSA (0.1)	MSA (0.3)	N (0.1)	NE (0.3)	A_CSB_ST
R67	L (0.2)	NSA (0.3)	MSA (0.1)	NE (0.3)	N (0.1)	A_RAAB_CS
R68	L (0.2)	NSA (0.1)	MSA (0.3)	NE (0.1)	NE (0.3)	A_CSB_ST
R69	L (0.2)	NSA (0.1)	NSA (0.1)	N (0.3)	N (0.3)	A_CSB_CS
R70	L (0.2)	NSA (0.1)	NSA (0.3)	N (0.1)	NE (0.3)	A_CSB_RAA
R71	L (0.2)	NSA (0.3)	NSA (0.1)	NE (0.3)	N (0.1)	A_RAAB_CS
R72	L (0.2)	NSA (0.3)	NSA (0.1)	NE (0.3)	NE (0.1)	A_RAAB_CS

表选项

其中Rule1具体说明如下:

Rule1:IF目标优先级较高p₁(0.2) AND A适合攻击p₄(0.3) AND B适合攻击p₇(0.1) AND A剩余燃油充足p₁₀(0.3) AND B剩余燃油充足p₁₂(0.1) THEN A攻击目标B继续搜索p₁₄(μ=0.9, λ=0.6)。

Rule1~Rule72阈值和信度值均假定为μ=0.9、λ=0.6。其输入命题和输出命题的库所编号定义分别如表 2和表 3所示。

表 2 输入命题对应的库所编号定义

TP H	TP M	TP L	A_SA	A_MSA	A_NSA	B_SA	B_MSA	B_NSA	A_FUELN	A_FUELNE	B_FUELE	B_FUELNE
p₁	p₂	p₃	p₄	p₅	p₆	p₇	p₈	p₉	p₁₀	p₁₁	p₁₂	p₁₃

表选项

表 3 输出命题对应的库所编号定义

A_STB_CS	A_CSB_ST	A_RAAB_CS	A_CSB_RAA	A_CSB_CS
p₁₄	p₁₅	p₁₆	p₁₇	p₁₈

表选项

2.3 基于分层的WFPN建模

本文应用分层的思想:根据设计的规则集, 分别以目标优先级较高、目标优先级中等、目标优先级较低建立A、B两无人机自主任务决策的Petri网子模型, 将完整的无人机自主任务决策的Petri网模型拆分成3块, 如图 4所示。

图 4 WFPN模型分层示意图

图选项

3 仿真与分析 3.1 矩阵和向量初始化

根据定义1、规则集表 1以及表 2、表 3的定义得到各类矩阵和向量为:子模型1输入矩阵为I₁、输出矩阵为O₁、阈值向量为λ₁; 子模型2输入矩阵为I₂、输出矩阵为O₂、阈值向量为λ₂; 子模型3输入矩阵为I₃、输出矩阵为O₃、阈值向量为λ₃。

3.2 仿真算例1

1)仿真数据的给出

假定战场环境下某时刻, A、B两机同时跟踪到同一目标。该目标优先级为TP[0.1, 0.1, 0.8], A、B两机攻击适合值分别为A_SVA[0.1, 0.1, 0.8]、B_SVA[0.05, 0.05, 0.9], A、B两机剩余燃油分别为A_FUEL[0.9, 0.1]、B_FUEL[0.9, 0.1]。该目标为低优先级目标, 采用子模型3输入矩阵I₃、输出矩阵O₃、阈值向量λ₃进行形式化推理计算。命题库所初始值根据上述初始状态描述表示为α₁₃⁰=[0.8 0.1 0.1 0.8 0.05 0.05 0.9 0.9 0.1 0.9 0.1 0 0 0 0 0]^T。

2)推理计算

令K=0, 将命题初始向量α₁₃⁰, 输入矩阵I₃, 输出矩阵O₃, 阈值向量λ₃分别带入公式α^k+1=α^k⊕[O⊗(I^T·α^k)⊖λ]中执行计算。

K=1时：α₁₃¹=[0.8 0.1 0.1 0.8 0.05 0.05 0.9 0.9 0.1 0.9 0.1 0 0 0.549 0.567 0.783]^T

K=2时：α₁₃²=[0.8 0.1 0.1 0.8 0.05 0.05 0.9 0.9 0.1 0.9 0.1 0 0 0.549 0.567 0.783]^T

根据推理步骤, 当α₁₃²=α₁₃¹时推理结束, 得到p₁₄=0, p₁₅=0, p₁₆=0.549, p₁₇=0.567, p₁₈=0.783。

3)推理结果分析

按照最大置信度原则, 无人机决策结果为A继续搜索B继续搜索(p₁₈)。说明A、B两机在发现一低优先级目标后, 由于A、B两机都不适合攻击, 且剩余燃油都较充足, 故而都采取继续搜索的策略。

3.3 仿真算例2

1)仿真数据的给出

假定A、B两机飞行一段时间后, 又同时跟踪到新的同一目标。各状态值变化为:TP[0.9, 0.05, 0.05]、A_SVA[0.8, 0.1, 0.1]、B_SVA[0.1, 0.1, 0.8]、A_FUEL[0.2, 0.8]、B_FUEL[0.7, 0.3]。该目标为高优先级目标, 采用子模型1输入矩阵I₁、输出矩阵O₁、阈值向量λ₁进行形式化推理计算。命题库所初始值根据上述初始状态描述表示为α₂₁⁰=[0.9 0.8 0.1 0.1 0.1 0.1 0.8 0.2 0.8 0.7 0.3 0 0 0 0]^T。

2)推理计算

令K=0, 将命题初始向量α₂₁⁰, 输入矩阵I₁, 输出矩阵O₁，阈值向量λ₁分别带入公式a^k+1=a^k⊕[O⊗((I^T·α^k)⊖λ)]中执行计算。

K=1时：α₂₁¹=[0.9 0.8 0.1 0.1 0.1 0.1 0.8 0.2 0.8 0.7 0.3 0.738 0 0.540 0]^T

K=2时：α₂₁²=[0.9 0.8 0.1 0.1 0.1 0.1 0.8 0.2 0.8 0.7 0.3 0.7380 0 0.5400 0]^T

根据推理算法要求, 当α₂₁²=α₂₁¹时推理结束, 得到p₁₄=0.738, p₁₅=0, p₁₆=0.540, p₁₇=0。

3)推理结果分析

按照最大置信度原则, 无人机决策结果A攻击目标B继续搜索。说明A、B两机在发现一高优先级目标后, A无人机适合攻击且剩余燃油较低, B无人机不适合攻击且剩余燃油较高, 故而采取A攻击目标B继续搜索的策略。

3.4 分析说明

仿真算例1、仿真算例2决策结果如表 4所示。基于WFPN形式化推理决策结果与专家决策结果相吻合, 验证了A、B两机搜索/攻击自主任务推理决策结果的合理性。

表 4 A、B两无人机自主飞行任务决策结果示例

仿真算例	当前状态	决策结果
1	TP[0.1, 0.1, 0.8] A_SVA[0.1，0.1，0.8] B_SVA[0.05，0.05，0.9] A_FUEL[0.9，0.1] B_FUEL[0.9，0.1]	A_CSB_CS
2	TP[0.9，0.05，0.05] A_SVA[0.8，0.1，0.1] B_SVA[0.1，0.1，0.8] A_FUEL[0.2，0.8] B_FUEL[0.7，0.3]	A_STB_CS

表选项

4 结论

本文将WFPN形式化推理方法应用于无人机搜索/攻击自主任务推理决策中, 通过命题权值的引入, 使得上述任务存在的不同输入命题对结论贡献大小不同的情形, 在推理决策过程中得到较合理的反映; 为进一步适应上述任务想定下规则集中存在的多条规则的输出命题是相同的情形, 本文对WFPN形式化推理算法进行了改进; 设计了两机搜索/攻击自主任务决策加权模糊产生式规则集; 应用分层的策略, 采用改进的WFPN形式化推理算法, 仿真验证了双机搜索/攻击自主任务推理结果的合理性, 并避免了计算过程中矩阵维数较高的问题。

参考文献

[1]	Department of Defense USA. Unmanned Aircraft Systems Roadmap2013-2038[R]. 2013

[2]	丁富玲, 李承家. 模糊Petri网的发展[J]. 杭州电子科技大学学报, 2008, 28 (6): 147–150. Ding Fuling, Li Chengjia. A Survey of Fuzzy Petri Nets[J]. Journal of Hangzhou Dianzi University, 2008, 28(6): 147–150. (in Chinese)

[3]	Gao Meimei, Zhou Mengchu. Control Strategy Selection for Autonomous Vehicles in a Dynamic Environment[C]//Systems, Man and Cybernetics, 2005(2):1651-1656

[4]	Sun Limin, Meng Chen, Yang Sen, Li Hao. A Method for Fault Diagnosis in Missile Based on Fuzzy Petri Net[C]//2012 International Conference on Industrial Control and Electronics Engineering, 2012, 5:1911-1913

[5]	Gao Meimei, Zhou Mengchu, Tang Ying. Intelligent Decision Making in Disassembly Process Based on Fuzzy Reasoning Petri Nets[J]. IEEE Trans on Systems, Man, and Cybernetics, Part B, 2004, 34(5): 2029–2034. DOI:10.1109/TSMCB.2004.833331

[6]	史志富, 张安, 刘海燕, 等. 基于模糊Petri网的空战战术决策研究[J]. 系统仿真学报, 2007, 19 (1): 63–66. Shi Zhifu, Zhang An, Liu Haiyan, et al. Study on Air Combat Tactics Decision-Making Based on Fuzzy Petri Nets[J]. Journal of System Simulation, 2007, 19(1): 63–66. (in Chinese)

[7]	赵振宇, 周锐, 池沛. 基于模糊推理Petri网的无人机智能决策方法[J]. 兵工自动化, 2015, 34 (3): 71–73. Zhao Zhenyu, Zhou Rui, Chi Pei. UAV Intelligent Decision Method Based on Fuzzy Reasoning Petri Net[J]. Ordnance Industry Automation, 2015, 34(3): 71–73. (in Chinese)

[8]	Liu Jiufu, Chen Kui, Wang Zhisheng. Fault Analysis for Flight Control System Using Weighted Fuzzy Petri Nets[J]. Journal of Convergence Information Technology, 2011, 6(3): 146–155. DOI:10.4156/jcit

[9]	Chen Shyiming. Weighted Fuzzy Reasoning Using Weighted Fuzzy Petri Nets[J]. IEEE Transs on Knowledge and Data Engingeering, 2002, 14(2): 386–397. DOI:10.1109/69.991723

[10]	张墨华.基于模糊Petri网的PAAIS知识处理研究[D].西安:西北工业大学, 2006 Zhang Mohua. PAAIS Knowledge Processing Research Based on fuzzy Petri nets[D]. Xi'an, Northwestern Polytechnic University, 2006(in Chinese) http://cdmd.cnki.com.cn/Article/CDMD-10699-2006057533.htm

Reasoning and Decision Making for Autonomous UAVs Based on Weighted Fuzzy Petri Nets

Tan Yanying¹, Tong Ming², Zhang Yanning³, Zhu Xiaoping⁴

1. Institute of Precision Guidance and Control, Northwestern Polytechnic University, Xi'an 710072, China;
2. The Chinese People's Liberation Army 68128 Forces, Lanzhou 730000;
3. School of Computer, Northwestern Polytechnic University, Xi'an 710129, China;
4. UAV Research Institute, Northwestern Polytechnic University, Xi'an 710065, China

Abstract: This paper is dealt with autonomous reasoning and decision-making for unmanned aerial vehicles (UAVs) executing the search and attack mission. There exists the fact in the above reasoning envision that each input proposition does different contribution to the conclusion of the rule, and so the formalized reasoning method based on weighted fuzzy Petri nets (WFPN) is studied. The weighted fuzzy production rule set about two UAVs cooperating in search and attack mission is designed. The formalized reasoning method based on WFPN is further improved to adapt to the situation that the output propositions of several rules are the same in the above rule set. Applied the layered strategy, the improved formalized reasoning method is simulated based on the designed rule set. The simulation shows that the reasoning results are reasonable and the dimension of the large reasoning matrix is reduced efficiently.

Key words: unmanned aerial vehicles (UAVs) autonomous weighted fuzzy petri nets (WFPN) formalized reasoning layered strategy decision making

西北工业大学主办。

文章信息

谭雁英, 童明, 张艳宁, 祝小平

Tan Yanying, Tong Ming, Zhang Yanning, Zhu Xiaoping

基于加权模糊Petri网的无人机自主任务推理决策研究

Reasoning and Decision Making for Autonomous UAVs Based on Weighted Fuzzy Petri Nets

西北工业大学学报, 2016, 34(6): 951-956.

Journal of Northwestern Polytechnical University, 2016, 34(6): 951-956.

文章历史

收稿日期: 2016-03-29

文章信息

文章历史

相关文章

工作空间