异构多智能体联盟动态任务分配
李相民1, 唐嘉钰1, 代进进1, 薄宁2     
1. 海军航空大学, 山东 烟台 264001;
2. 解放军 91213 部队, 山东 烟台 264001
摘要: 研究了突发新任务的动态场景下异构多无人机智能体分布式联盟任务分配问题,主要包括两方面内容:首先扩展了一致性包算法(consensus based bundle algorithm,CBBA),考虑任务载荷资源约束、子任务耦合关系约束及执行窗口约束等条件提出了一致性联盟算法(consensus based coalition algorithm,CBCA);其次,针对新任务出现的动态应用需求,研究了3种动态任务分配策略,分别为无重规划动态分配策略(consensus based coalition algorithm with no resetting,NR-CBCA)、完全重规划动态分配策略(consensus based coalition algorithm with full resetting,FR-CBCA)及部分重规划动态分配策略(consensus based coalition algorithm with partial resetting,PR-CBCA)。最后,以侦察型无人机和攻击型无人机协同执行对地侦察攻击任务为例,验证了CBCA算法的可行性及3种分配策略对动态任务场景的适用性。
关键词: 多智能体系统    分布式决策    一致性包算法    动态任务分配    

随着现代信息与通信技术和人工智能技术的发展,具有自主能力的无人机智能体在现代战场上得到越来越广泛的应用[1]。然而面对日趋复杂的现代战场环境,由于单个无人机所发挥的功能有限,许多作战任务需要多个无人机智能体协同完成,每个无人机智能体分别执行一系列任务[2]。实际作战环境不断动态变化,新任务及无人机智能体受损等不确定事件的出现会使原有任务分配方案不能满足任务需求[3]。多无人机智能体联盟动态任务分配研究逐渐成为当前热点[4]

针对多无人机智能体联盟动态任务分配问题,文献[5]提出了一种基于分布式拍卖机制的多无人机协同作战动态目标分配方法。文献[6]提出了一种引入指挥员人为干预的动态任务分配机制,指挥员手动操作实现任务分配结果动态调整。但这一方法耗时较长,且确保指挥员与无人机间通信稳定可靠。文献[7]基于分阶段贪心规划算法(phased greedy planning algorithm, PGPA)对异构多无人机智能体分发资源问题进行了研究,算法实时性较强。文献[8]提出了基于监督顺序拍卖机制的任务重分配方法,对战场环境中突发新任务由拍卖者随机产生拍卖顺序,各无人机顺序投标选择任务,直至所有突发均被选择为止。文献[9]以异构多无人机协同执行防空压制任务为背景,采用了分布式遗传算法解决多无人机智能体协同任务分配问题,模型中考虑了飞行器载荷类型及末端进入目标角度等约束条件。

随着地面防空武器的不断发展,多无人机智能体协同执行作战任务时间更为紧凑,“时间窗口作战”特性不断增强[10]。同时,对于复杂作战任务,通常需要先对目标附近区域进行预先侦察,完成目标特征确认后完成对地攻击,因而任务之间存在时序约束关系且分别需要一定的执行时间[11]。但目前上述相关研究中对任务时序约束及执行时间窗口考虑不充分,缺少对时序耦合关系及时间窗口约束下多无人机智能体联盟动态任务分配问题的研究。

一致性包算法(CBBA)具有快速收敛至无冲突分配方案的优点[12]。本文针对任务载荷资源约束、任务耦合关系约束及执行窗口约束等条件下的异构多智能体动态联盟任务分配问题,首先基于CBBA算法,提出了一致性联盟算法;在此基础上,针对突发新任务出现的动态场景,给出了3种动态任务分配策略。最后,以多架无人侦察飞机(unmanned search aerial vehicle, USAV)和UCAV(unmanned combat aerial vehicle, UCAV)协同执行对地侦察攻击任务为任务背景,通过仿真实验验证了该算法及3种动态分配策略的可行性和算法性能。

1 多无人机智能体联盟任务分配问题描述 1.1 任务空间

本文研究任务表述如下:在预先已知战场态势感知信息的情况下,携带有不同种类载荷资源的异构无人机智能体,协同完成任务区域内具有时间窗口、耦合时序及载荷资源种类等多种约束各项作战任务。本文中载荷资源均为不可消耗类。

首先给出任务空间相关参数描述。

1) 无人机智能体集

I{1, …, Na}代表执行作战任务的无人机智能体集合(为简洁表达, 下文中所有智能体均指无人机智能体), 其中iI为智能体唯一身份标识, Na为智能体数量。智能体异构性主要表现在携带载荷资源种类及运动学性能有所不同。无人机iI采用四元组〈Pi, Ri, Vi, Li〉表示, 其中Pi为智能体位置坐标, Ri为智能体iI携带载荷资源列表, Vi为智能体速度, Li为智能体i执行任务数量上限。

2) 任务集

J{1, …, NT}为战场环境中的任务集, NT为任务数量。任务jJ采用元素组〈Pj, , njt, tj, njS, Dj, Tj〉描述, 其中Pj为任务位置坐标; 为执行该任务所需载荷资源种类列表, =ø则表示任务j对智能体携带资源无要求, 所有智能体都可投标; njt为任务j所需智能体数量, njt>1时表示任务j需要多架无人机智能体组成联盟协同完成; tj={τjstart, τjend, τjlast, λj}为执行该任务时间约束集合, 其中τjstartτjend分别为任务j执行最早和最晚时间节点, τjlast为任务持续时间, 0≤λj < 1为任务时间折扣因子, 用于在后续计算任务时效收益值; njS为任务j包含的子任务类数, 子任务类别通过所需载荷资源种类划分

(1)

为子任务时序耦合关系矩阵, 其中dwq表示子任务w和子任务q之间的耦合关系约束, dwq=1表示子任务w和子任务q之间存在时序关系约束, dwq=0表示2个子任务之间无时序约束关系; 当子任务之间存在时序关系约束时, wq起始时间存在最小时间间隔Δtmin, 即有

(2)

式中,Tj为子任务时序间隔矩阵。

1.2 多无人机智能体联盟任务分配模型

异构多智能体联盟任务分配问题为典型混合整数线性规划问题, 即:给定任务集J{1, …, NT}和智能体集合I{1, …, Na}, 寻求满足智能体本体和任务执行等约束条件的最优任务分配方案, 从而使得系统效用最大。

采用文献[14]的分布式整数规划模型, 上述问题可描述为

(3)

式中:pi为智能体i执行所分配任务的顺序;Sij为智能体i执行任务j的收益; xij ∈{1, 0}为任务分配决策变量;xij=1表明智能体i执行任务j, 否则xij=0。公式(3)需满足以下假设:

1) 智能体i执行任务j的收益为智能体到达任务时间的函数;

2) 智能体i到达任务j处时间由任务执行顺序pi唯一确定;

3) pi由智能体i任务分配决策变量xi唯一确定。

2 一致性联盟算法

CBBA算法在异构多智能体协同执行某项任务的场景中具有一定局限性[13]。本节在CBBA算法基础上提出了一致性联盟算法(consensus based coalition algorithm, CBCA)。

2.1 算法关键要素

首先给出CBCA算法中有关智能体i任务分配信息的关键要素:

1) 任务路径列表pi

任务路径列表pi{pi1, …, pi|pi|}表示分配给智能体i的待执行任务列表, 列表中元素按照i计划执行顺序排列, |pi|表示列表长度。pi=ø表示智能体i路径列表为空。

2) 任务包bi

任务包bi{bi1, …, bi|bi|}表示分配给智能体i的任务集合, 集合中元素按任务加入包的先后顺序排列, |bi|代表bi列表长度, 且有|bi|≤|pi|。bi=ø表示智能体i任务包为空。

3) 获胜智能体矩阵Zi

ZiNa×NT维矩阵, 其中zkji=1表示智能体i认为智能体k是任务j的投标获胜者; 否则zkji=0。Zi中第j列非零元素数量之和Njsum=zkji代表了智能体i认为执行任务j的智能体总数。

4) 获胜投标值矩阵Yi

Yi存储智能体i视角下各项任务联盟成员的投标值, 矩阵中各元素与Zi一一对应。当智能体i认为任务j没有获胜者时, yij=-∞。

5) 时间戳列表si

时间戳列表si{si1, …, siNa}记录智能体i从相邻其他智能体中获得更新信息的时刻, 其中sik表示智能体i从智能体k获得最新信息的时刻。si是冲突消除的重要指标, 表征了智能体i从相邻智能体获得信息的新旧程度。

2.2 任务包构建

CBBA算法的基础是顺序贪婪算法(sequential greedy algorithm, SGA), 即每个智能体每次以最大化自身任务收益增量为原则选择任务。设智能体i初始任务包为bi, i选择收益边际增益最大的任务j*J加入到bi中。任务选择过程持续到任务包已满或无可选任务。智能体只对满足时间窗约束和载荷资源约束的有效任务进行投标。

智能体i沿任务路径pi的收益为

(4)

式中:rij(pi)为任务执行收益, 考虑任务动态时效性, 采用时间折扣收益来计算, 即

(5)

式中:rj为任务j的静态收益;τij(pi)为智能体i沿路径pi执行任务j的估计时间。

ξij为智能体行程损耗代价, 即

(6)

式中:dij为智能体i与任务j之间的直线距离;γ为行程代价系数。

依据新任务j′加入bi前后的收益, 可获得j′的边际增益为

(7)

式中:n表示j′在pi中所有可能位置;|pi|为路径列表长度;pin{j′}表示将j′插入到路径列表pi中第n位, 原路径列表中第n位及其以后的元素保持原顺序不变, 依次后移。

nj=1时, 任务j为单智能体执行型, 投标过程与CBBA算法相同, 详细步骤见文献[13]。当nj>1时, 任务j需要多智能体组成联盟协同完成, 此时任务j可分为两种情况:①竞标执行任务j的智能体数量已满足联盟智能体数量需求, 即Njsum=nj, 此时分配执行任务j的智能体数量已满荷; ②分配执行任务j的智能体数量未满足数量需求, 即Njsum < nj

任务j分配已满荷时, 智能体将自身边际增益与当前任务最小获胜投标值作比较, 当

(8)

时, 智能体i可以投标(hij=1), 并将最小获胜投标值替换为自身投标值; 否则, 智能体i放弃任务j(hij=0)。当智能体i投标值与最小获胜投标值相同时, 选择身份标识小的智能体。

智能体不断构造自身任务包直至任务包已满或没有满足约束条件的有效任务。具体CBCA任务包构造流程如算法1所示。

Algorithm 1: Bundle construction of CBCA

Input:Winning agents matrix Zi(t-1), winning bids matrix Yi(t-1), task bundle bi(t-1) and path list pi(t-1)

Output: Zi(t), Yi(t), bi(t) and pi(t)

1:While |bi(t-1)| < Li do

2:    cij=(pin{j})-Si(pi), ∀jJ

3:    for ∀jJ

4:        if njt>1 then

5:            if njt>zkji then

6:                hij=1

7:            else if cij>min(ykji), ∀kI then

8:                hij=1

9:            else

10:                hij=0

11:              end

12:          else

13:              hij=I(cij>ykji)

14:          end

15:      end

16:          Ji=argmaxjcijhij

17:          ni, Ji=argmaxnSi(pin{j})

18:          bi(t)=bi(t-1)⊕end{Ji}

19:          pi(t)=pi(t-1)⊕nj, Ji{Ji}

20:          yii, Ji (t)=ci, Ji

21:          zii, Ji (t)=1

22:          end while

2.3 基于一致性的冲突消解

任务包构建结束后, 智能体需要与相邻智能体交换获胜智能体列表、获胜投标列表和时间戳列表等信息, 并按照一定的行动规则更新信息以获得无冲突任务分配。

具体冲突消解过程如算法2所示。

Algorithm 2: Conflict resolution of CBCA

Input: Winning agents matrix Zk(t-1), winning bids matrix Yi(t-1) and time stamp sk(t-1) from agent k

Output: Zi(t), Yi(t) and si(t)

1:send Zi(t-1), Yi(t) and si(t-1) to its neighbor agent k

2:receive Zk(t-1), Yk(t-1) and sk(t-1) from agent k

3:for ∀jJ

4:          if njt=then

5:              run consensus resolution of CBBA

6:          else

7:              for ∀mI where zmji=1

8:                    if k=m and skm>sim then

9:                      zmji=zmjk

10:                        ymji=ymjk

11:                    end

12:                  end

13:                  for ∀mI where zmjk=1

14:              if mi and zmji=0 and skm>sim then

15:                  if zmji < njt then

16:                      zmji=zmjk

17:                      ymji=ymjk

18:              else

19:                  if min(ynjin) < ymjk and RmRnø then

20:                      znji=0, zmji=zmjk

21:                      ynji=-∞, ymji=ymjk

22:                      end

23:                  end

24:              end

25:          end

26:      end

27:          sik=t

28:end

3 动态联盟任务分配策略

CBCA算法适用任务信息预先已知的静态场景。当任务空间出现更有打击价值的新任务T*时, 需设计动态重分配机制, 以快速获得重分配方案保证作战任务顺利进行。本节针对新任务出现的分布式联盟动态任务分配问题, 提出了动态任务分配策略。

3.1 无重规划动态分配策略(NR-CBCA)

无重规划分配策略(consensus based coalition algorithm with no resetting, NR-CBCA)中, 当新任务T*出现时, 多智能体系统在原有任务分配基础上考虑将新任务插入自身任务包, 即在任务包构造中, pi(t)=pi(t-1), bi(t)=bi(t-1)。此时, 满足载荷资源需求的智能体i投标值为

(11)

式中,pin{T*}表示将T*插入到路径列表pi中第n位。进一步, 当T*位于pi中第n*位时有

(12)

进一步考虑到

(13)

则有

(14)

yiT*i可以分解为两部分, 第一部分((14)式中第一行)代表智能体i沿新任务路径pi执行T*的收益值, 第二部分((14)式中2~3行)代表智能体执行同样的任务沿任务路径p′ipi的收益差值。注意到执行顺序在T*之前的任务收益保持不变, 因此第二部分可简化为

(15)

由(15)式可知, 执行任务T*的边际增益包含两部分内容, 一部分是任务T*时效收益, 另一部分为由于插入任务T*导致后续任务延迟执行的收益差值。尽早执行任务T*, 可提高任务T*时效收益; 但同时会导致列表中更多任务因为延迟执行而导致收益值降低。因此任务T*p′i中的位置需综合权衡两方面因素。

NR-CBCA策略具有快速响应、算法收敛性不受新任务影响的优点。但智能体i只有在已分配任务数量少于Li时, 才可以对新任务竞标。当突发新任务价值较高或对载荷资源要求较严时, NR-CBCA策略求解质量较差。因此释放原有任务列表, 进行重规划可保证任务T*的分配不受之前任务分配结果的影响。

3.2 完全重规划动态分配策略(FR-CBCA)

在完全重规划策略(consensus based coalition algorithm with full resetting, FR-CBCA)中, 当发现新任务时, 符合任务资源需求的智能体清空原有任务分配结果, 重新构造任务包和路径列表, 即pi(t)=ø, bi(t)=ø。通过将任务包和任务路径列表重置为空, FR-CBCA策略可以有效消除原有任务分配结果对新任务分配的局限, 通过灵活重构任务包和任务路径列表, 降低T*可能导致的边际增益损耗。

虽然FR-CBCA策略具有灵活性强、提高多智能体协作能力的优点, 但它需要一定的时间完成完整重分配。同时由于将原有任务包和任务路径列表重置为空集, 重规划可能导致多智能体系统扰动, 即系统始终处于重规划状态中, 无法获得一致无冲突的任务分配结果, 原有任务分配问题解的收敛性难以保证。

3.3 部分重规划动态分配策略(PR-CBCA)

为了更好地权衡动态任务分配时算法收敛速度与算法总收益, 提出了一种部分重规划的动态联盟任务分配策略(consensus based coalition algorithm with partial resetting, PR-CBCA)。在PR-CBCA策略中, 每个智能体在任务包构建时从自身任务包释放收益值最低的nreseti个任务, 保留其余任务不变。nreseti数值大小可以通过综合考虑新任务数量及响应速度需求来确定。当新任务频繁出现、多智能体系统需要在下一批新任务出现前实现无冲突任务分配时, 可以设定nreseti数值较小; 当新任务价值很高时, 则可以通过释放更多任务来提高智能体协作能力。

Algorithm 3: CBCA with partial resetting (PR-CBCA)

Input: A subset of agents Ireset participating in the replanning, a desired response time tresponse, a communication period tcomm

Output: Zi(t), Yi(t), bi(t) and pi(t)

1: d=Diameter(Ireset)

2: nreseti=

3: ysorti=Sort(yii)

4: Jreseti={jJ|yijiysorti [1:nreseti]}

5: for iIreset do

6: for jJreseti do

7:                  pi(t)=pi(t-1)! j

8:                  bi(t)=bi(t-1)! j

9:                  yiji=-∞

10:                  ziji=0

11:    end for

12:end for

在PR-CBCA策略中, 当新任务出现时, 符合新任务载荷资源需求的智能体将收益值最低的nreseti个任务从自身任务包和路径列表中释放, 并重置相应的获胜投标值与获胜智能体矩阵元素数值。通过选择符合载荷资源、参与重规划智能体子集Ireset大小, 可以实现更为灵活的动态分配, 当多智能体系统规模较大时, 可选择较多智能体释放较少任务进行重规划; 或者选择较少数量智能体进行完全重规划。通过改变nreseti数值可以看出, NR-CBCA策略和FR-CBCA策略为PR-CBCA策略在nreseti=0和nreseti=Li时的2个特例。

4 仿真结果及分析

以动态环境下多架USAV和UCAV执行侦察与攻击任务为例, 对CBCA算法及动态任务分配策略进行仿真验证。战场任务主要划分为3类:仅需USAV进行侦察搜索的侦察类任务、仅需UCAV进行对地攻击的攻击类任务及需由USAV先执行侦察确认随后UCAV进行攻击的察打类任务。

4.1 CBCA算法仿真结果分析

算例1中共有5架无人机对9个地面固定目标进行侦察攻击, 任务空间范围设定为5 km×5 km×2 km, 无人机和目标初始状态信息如表 1表 2所示。侦察类任务需要2架USAV执行, 攻击类任务需要2架UCAV协同完成, 察打类任务需2架USAV和1架UCAV。察打类任务可分为侦察子任务和攻击子任务, 其对应子任务耦合关系矩阵为

表 1 无人机参数设定
UAV序号能力类型可执行最大任务数Li初始位置/km速度/(m·s-1)γi
1USAV5(2.3, 3.4, 1.0)300.5
2UCAV5(3.7, 4.8, 1.2)500.8
3USAV5(4.4, 0.4, 1.0)300.5
4USAV5(1.2, 4.9, 1.5)500.8
5UCAV5(4.5, 2.7, 1.0)500.5
表 2 任务空间参数设定
任务号初始位置Pj/km任务类型静态收益rj时间折扣因子λj任务耗时τjlast/min任务时间窗口[τj, τstartjend]/min
1(2.5, 3.0, 0)察打类3000.715[0, 30]
2(2.4, 1.6, 0)攻击类2000.810[20, 70]
3(3.2, 3.0, 0)侦察类2000.610[10, 100]
4(5.0, 3.3, 0)攻击类2000.85[40, 90]
5(3.5, 4.9, 0)察打类3000.715[45, 100]
6(4.2, 4.8, 0)侦察类2000.610[60, 100]
7(4.1, 4.9, 0)攻击类2000.85[60, 100]
8(0.5, 1.0, 0)侦察类2000.610[70, 100]
9(2.9, 0.9, 0)侦察类2000.615[80, 120]

相应时序间隔矩阵为

矩阵DsaTsa行(/列)元素按顺序分别代表侦察子任务和攻击子任务, 其中d12(d21)=1表明侦察子任务与攻击子任务之间存在时序约束关系, Δtmin=10 min为UCAV执行攻击子任务前USAV完成侦察子任务所需的最短时间。需要2架无人作战/侦察飞机协同完成的攻击/侦察任务只包含一类子任务, 此时子任务关系矩阵为Ds/a=ø, 对应时序间隔矩阵为Ts/a=ø

算例1中CBCA算法分配结果和各UAV的任务路径列表分别如表 3图 1所示。对察打类任务Task1和Task5, 首先UAV1和UAV3进行侦察确认, 侦察子任务结束后UAV5执行攻击任务, 满足子任务耦合时序关系。算法总收益值为1 805.01。仿真结果表明CBCA算法可解决复杂约束条件下异构多智能体联盟任务分配问题。

表 3 联盟任务分配结果
UAV序号任务路径pi任务起始时间/min任务收益
1{1, 3, 5, 8, 9}{3.24, 20, 45.63, 73, 90}{98.44 72, 83.958 7, 98.565 2, 83.836 7, 83.433 1}
2{2, 4, 7}{33.420 0, 67.430 0, 80}{97.997 2, 98.188 3, 98.982 3}
3{1, 3, 5, 6, 9}{3.24, 20, 45.63, 61.244 5, 90}{99.281 8, 83.713 0, 98.438 8, 37.900 6, 82.954 7}
4{6, 8}{60, 73}{83.722 1, 83.555 6}
5{1, 2, 5, 4, 7}{13.24, 33.420 0, 55.63, 67.430 0, 80}{98.057 2, 98.223 0, 98.991 0, 98.658 4, 98.105 7}
图 1 算例1无人机任务路径
4.2 算法最优性评估

将CBCA算法与量子蚁群算法[15]进行比较, 分别记录算法平均总收益值, 以实现对CBCA算法最优性评估。算例2中5架无人机对9个目标进行攻击, 随机产生无人机和目标的初始位置, 任务空间范围设定为5 km×5 km×2 km, 任务静态收益均为100, 时间折扣因子为0, Δtmin=10 min。设定仿真次数为50次, 量子蚁群算法中以多无人机收益最大为目标函数, 蚂蚁数为50, 迭代次数为100次, 其余试验参数设置同文献[15]。对比结果如图 2所示。

图 2 QACA与CBCA算法收益值对比

仿真结果表明集中式量子蚁群算法任务分配收益值优于分布式CBCA算法, CBCA算法平均收益值为量子蚁群算法最优收益值均值的83.3%。造成这一结果的主要原因在于集中式量子蚁群算法从全局角度实现异构多无人机最优化任务分配, 而基于贪婪策略的分布式CBCA算法则以个体边际效益最大为投标原则。

4.3 动态场景验证

算例3中无人机群完成初始联盟任务分配后, 出现侦察类新任务, 任务时间窗口(min)为[30, 100], 初始位置km为(2.86, 0.91, 0), 任务静态收益为100, 其余参数设置同算例1, Ireset={UAV1, UAV3, UAV4}, nreset=2。分别记录动态任务分配策略下任务路径列表(如图 35所示), 总收益值及算法运行时间对比结果如表 4所示。

图 3 算例3NR-CBCA策略无人机任务路径列表
图 4 算例3FR-CBCA策略无人机任务路径列表
图 5 算例3PR-CBCA策略无人机任务路径列表
表 4 动态分配策略对比结果
动态分配策略算法总收益值算法运行时间/s
NR-CBCA1 902.842 33.195 3
FR-CBCA1 918.354 43.305 4
PR-CBCA1 925.467 33.245 6

仿真结果表明NR-CBCA策略耗时最短, 但是总收益值最低; FR-CBCA策略和PR-CBCA策略总收益值较高, 但是由于释放原有任务列表, 算法总运行时间更长。FR-CBCA策略收益值略低于PR-CBCA策略的主要原因是, FR-CBCA策略中侦察类无人机UAV1、UAV3及UAV4清空自身原有任务列表, 并重构自身任务包。以UAV3为例, FR-CBCA策略中新路径列表p′3总收益值为417.746 6;PR-CBCA策略中p′3总收益值为424.913 8。对比可以看出FR-CBCA策略中p′3加入新任务后, 由于任务时效因子影响, 导致列表中后续任务收益值降低。

4.4 动态任务分配性能比较

算例4中将基于CBCA算法的3种动态任务分配策略与基于改进合同网协议(ICNP)方法[16]进行比较。由于动态任务分配结果受任务时间窗口约束影响表现出随机性, 因此, 记录各不同无人机、任务数量组合下, 30次不同初始条件下算法平均收益值和平均运行时间。分别选取任务数量为6, 9, 12, 无人机数量为6~20, 侦察型和攻击型无人机配比为1:1, 不同情况下侦察类和攻击类任务配比如表 5所示。记录结果如图 6图 7所示。

表 5 不同情况下各型任务配比
序号任务数量侦察类任务数量攻击类任务数量
1633
2945
31266
图 6 动态任务分配算法收益值对比
图 7 动态任务分配算法运行时间对比

相比于ICNP算法,基于CBCA算法动态任务分配策略性能更优。3种动态任务分配策略均能解决复杂约束条件下异构多智能体动态联盟任务分配问题,但性能有所差异,NR-CBCA策略具有更好的实时性,但算法收益较低;FR-CBCA策略收益最高,但算法平均运行时间较长;PR-CBCA策略在保证任务分配结果质量的基础上,实现对动态场景的实时响应。

5 结论

1) 针对复杂约束条件下的异构多无人机智能体联盟任务分配问题,提出了一致性联盟(CBCA)分布式任务分配算法。仿真结果表明该算法可以实现复杂约束条件下完全分布式异构多无人机智能体系统任务分配;

2) 针对任务空间出现新任务的动态性,基于CBCA算法提出了动态任务分配策略,仿真结果表明3种动态分配策略均可获得高效合理的动态分配结果,FR-CBCA策略结果最优但耗时最长,NR-CBCA策略实时性较好但动态分配收益值最低,通过灵活设定参与重规划的智能体及释放任务数量,PR-CBCA策略在保证规划结果质量基础上,实现了对突发新任务及时响应。

参考文献
[1] 齐小刚, 李博, 范英盛, 等. 多约束下多无人机的任务规划研究综述[J]. 智能系统学报, 2020, 15(2): 204-217.
QI Xiaogang, LI Bo, FAN Yingsheng, et al. A Survey of Mission Planning on UAV System Based on Multi-Constraints[J]. CAAI Transactions on Intelligent Systems, 2020, 15(2): 204-217. (in Chinese)
[2] 姚佩阳, 万路军, 孙鹏, 等. 基于RHP-IVFSA的多智能体编组任务分配动态优化[J]. 系统工程与电子技术, 2014, 36(7): 1309-1319.
YAO Peiyang, WAN Lujun, SUN Peng, et al. Dynamic Task Allocation in Multiple Agent Groups Based on RHP-IVFSA[J]. Systems Engineering and Electronics, 2014, 36(7): 1309-1319. (in Chinese)
[3] YI Wei, BLAKE M B, GREGORY R. Madey[J]. An Operation-time Simulation Framework for UAV Swarm Configuration and Mission Planning[C]//Procedia Computer Science 18, 2013: 1949-1958.
[4] 吴蔚楠, 崔乃刚, 郭继峰. 基于目标信息估计的分布式局部协调任务分配方法[J]. 控制理论与应用, 2018, 35(4): 566-576.
WU Weinan, CUI Naigang, GUO Jifeng. Distributed Task Assignment Method Based on Local Information Consensus and Target Estimation[J]. Control Theory and Applications, 2018, 35(4): 566-576. (in Chinese)
[5] 陈洁钰, 姚佩阳, 唐剑, 等. 多无人机分布式协同动态目标分配方法[J]. 空军工程大学学报, 2014, 15(6): 11-16.
CHEN Jieyu, YAO Peiyang, TANG Jian, et al. Multi-UAV Decentralized Cooperative Dynamic Target Assignment Method[J]. Journal of Air Force Engineering University, 2014, 15(6): 11-16. (in Chinese)
[6] RAMCHURN S D, FISCHER J E, IKUNO Y, et al. A Study of Human-Agent Collaboration for Multi-UAV Task Allocation in Dynamic Environments[C]//International Joint Conference on Artificial Intelligence, Buenos Aires, Argentina, 2015
[7] 钟赟, 姚佩阳, 万路军, 等. 多任务执行中无人机行动联盟形成模型及算法[J]. 系统工程与电子技术, 2017, 39(10): 2248-2254.
ZHONG Yun, YAO Peiyang, WAN Lujun, et al. UAV Action Coalition Formation Model and Algorithm in Multi-Task Execution[J]. Systems Engineering and Electronics, 2017, 39(10): 2248-2254. (in Chinese)
[8] 吴歇尔.面向多无人机的协同任务预分配及重分配研究[D].南昌: 南昌航空大学, 2018
WU Xieer. Coorctination Tasks Pre-Auocation and Redistribution Studies in UAVs[D]. Nanchang: Nanchang Hangkong University, 2018(in Chinese)
[9] 吴蔚楠, 关英姿, 郭继峰, 等. 基于SEAD任务特性约束的协同任务分配方法[J]. 控制与决策, 2017, 32(9): 1574-1582.
WU Weinan, GUAN Yingzi, GUO Jifeng, et al. Research on Cooperative Task Assignment Method Used to the Mission Sead with Real Constraints[J]. Control and Design, 2017, 32(9): 1574-1582. (in Chinese)
[10] ELLIOT M B. Flexible, Smart, and Lethal:Adapting US SEAD Doctrine to Changing Threats[J]. Air & Space Power Journal, 2016: 65-78.
[11] 吴蔚楠.多无人飞行器分布式任务规划技术研究[D].哈尔滨: 哈尔滨工业大学, 2018
WU Weinan. Research on Distributed Mission Planning for Multiaerial Vehicles[D]. Harbin: Harbin Institute of Tecnicalogy, 2018(in Chinese)
[12] 张耀中, 谢松岩, 张蕾, 等. 异构型多UAV协同侦察最优化任务决策研究[J]. 西北工业大学学报, 2017, 35(3): 385-392.
ZHANG Yaozhong, XIE Songyan, ZHANG Lei, et al. Optimal Task Decision-Making for Heterogeneous Multi-UAV Cooperation Reconnaissance[J]. Journal of Northwestern Polytechnical University, 2017, 35(3): 385-392. (in Chinese)
[13] CHOI H, BRUNET L, HOW J. Consensus-Based Decentralized Auctions for Robust Task Allocation[J]. IEEE Trans on Robot, 2009, 25(4): 912-926. DOI:10.1109/TRO.2009.2022423
[14] XIMO G, DANIEL S. Agent-Based Simulation Framework and Consensus Algorithm for Observing Systems with Adaptive Modularity[J]. System Engineering, 2018: 1-23.
[15] 冀俊忠, 程亮, 赵学武, 等. 量子蚁群算法求解多任务联盟问题[J]. 北京工业大学学报, 2013, 39(3): 341-346.
JI Junzhong, CHENG Liang, ZHAO Xuewu, et al. Quantum ant Colony Algorithm for the Multi-Task Coalition Problem[J]. Journal of Beijing University of Technology, 2013, 39(3): 341-346. (in Chinese)
[16] 李明, 刘玮, 张彦铎. 基于改进合同网协议的多Agent动态任务分配[J]. 山东大学学报, 2016, 46(2): 51-56.
LI Ming, LIU Wei, ZHANG Yanduo. Multi-Agent Dynamic Task Allocation Based on Improved Contract Net Protocol[J]. Journal of Shandong University, 2016, 46(2): 51-56. (in Chinese)
Dynamic Coalition Task Allocation of Heterogeneous Multiple Agents
LI Xiangmin1, TANG Jiayu1, DAI Jinjin1, BO Ning2     
1. Naval Aviation University, Yantai 264001, China;
2. Unit 91213 of PLA, Yantai 264001, China
Abstract: The dynamic coalition task allocation of heterogeneous multiple UAV agents is researched, which is divided into two parts. Firstly, the consensus based coalition algorithm(CBCA) is presented via consensus based bundle algorithm(CBBA), considering complex constraints of specific equipment requirements and coupling the relationships between the subtasks and the time windows. Secondly, three dynamic planning strategies are proposed in cope with appearance of new tasks during the allocation process. Finally, the feasibility and applicability of the present algorithm and dynamic planning strategies are validated in the scenario of a search and attack mission executed by multiple unmanned search aerial vehicles(USAVs) and unmanned combat aerial vehicles (UCAVs).
Keywords: multi-agent system    distributed decision making    consensus-based bundle algorithm(CBBA)    dynamic task allocation    
西北工业大学主办。
0

文章信息

李相民, 唐嘉钰, 代进进, 薄宁
LI Xiangmin, TANG Jiayu, DAI Jinjin, BO Ning
异构多智能体联盟动态任务分配
Dynamic Coalition Task Allocation of Heterogeneous Multiple Agents
西北工业大学学报, 2020, 38(5): 1094-1104.
Journal of Northwestern Polytechnical University, 2020, 38(5): 1094-1104.

文章历史

收稿日期: 2019-12-08

相关文章

工作空间