[发明专利]一种不确定环境下的分布式多无人机任务分配方法有效
| 申请号: | 201910513324.8 | 申请日: | 2019-06-14 |
| 公开(公告)号: | CN110134146B | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 符小卫;王辉;潘静;高晓光 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G05D1/10 | 分类号: | G05D1/10 |
| 代理公司: | 西北工业大学专利中心 61204 | 代理人: | 顾潮琪 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供了一种不确定环境下的分布式多无人机任务分配方法,首先建立协同任务分配模型,各无人机进行自己的任务束更新、构建,然后无人机编队进行一致性协商,实现不确定参数下最大化整体收益的目标。本发明利用一致性束算法CBBA,在分布式的架构下求解任务环境存在不确定参数时多无人机的时敏任务协同分配问题,利用高斯过程回归模型来捕捉不确定参数对任务分配收益的影响来参与分配过程从而保证任务分配结果的实际执行效果,利用主动学习和流形学习方法来提高算法的计算效率。 | ||
| 搜索关键词: | 一种 不确定 环境 分布式 无人机 任务 分配 方法 | ||
【主权项】:
1.一种不确定环境下的分布式多无人机任务分配方法,其特征在于包括下述步骤:步骤1,对于由Na个无人机组成的无人机编队,所有无人机均是同一类型;任务执行区域内有Nt个目标,无人机编队要对每个目标执行时敏任务,每个时敏任务的执行时间为tj,j=1,2...,Nt,其时间窗约束为ETj≤tj≤LTj,其中,ETj为任务j的最早允许开始执行时间,LTj为任务j的最晚允许开始执行时间;无人机i对目标j执行任务的收益
其中,Vj为目标j的价值,λ为指数折扣收益模型的递减因子,α为距离代价的惩罚因子,Lij为无人机i与目标j的欧式距离;每个任务的执行时长tj‑dur=gj(θ),其中,任务环境的不确定参数θ服从分布概率密度函数p(θ),函数关系gj在仿真时由历史数据或模型仿真获得;协同分配模型目的是求解决策矩阵x,xij=1表示分配无人机i对目标j执行任务,x∈χ,
每个无人机最多能够执行Li个任务,每个无人机维护以下数据信息结构:(1)任务束集(Bundle):
其中bin是竞拍到的目标,表示无人机i竞拍得到的第n个任务的序号;(2)任务时序集(Path):
任务时序Pi为无人机i的任务束Bi的任务执行顺序,即无人机i执行任务的顺序为
(3)执行时间集(Time):
τin∈R+表示无人机i根据任务时序集Pi到达任务区执行任务pin的执行时间;(4)赢家集(Winning Uavs):
其中元素zin表示无人机i与其所有邻接无人机通过信息交互所获得的关于任务j的赢家信息,即当前时刻无人机zin对任务j出价最高成为赢家;若当前尚未有无人机竞拍到任务j,则zi=φ;(5)赢家出价集(Winning Bids):
其中元素yin∈R+,用来表示当前时刻各无人机对任务j竞拍时的最大出价值,若当前尚未有无人机竞拍到任务j则yin=0;(6)时间戳集(Time Stamps):时间戳为
其中元素sin∈R+,用来表示无人机i与其邻接无人机之间的最近一次信息交互时间;(7)分配时间标记:[Tip,tip],Tip为通信的时间标记,无人机之间采用同步通信机制,每次协商阶段无人机i同通信网络中的其他所有无人机进行完通信,Tip自增;tip为无人机i进行任务束构建阶段的时间标记,无人机i任务束构建完有新任务加入时,tip自增;步骤2,已知无人机i和目标j的位置矢量、目标j任务Tj的价值和时间窗,构造信息结构Bi,Pi,τi的步骤如下:Step2.1,从j=1循环迭代到j=Nt,若
执行Step2.2到Step2.6,否则j自增;Step2.2,对于任务时序集Pi的每一个位置k=1到k=LPi,检测加入新任务Tj的可能性,若满足可能性转入Step2.3,LPi为无人机i的任务时序集里已经出价的任务个数;Step2.3,求Tj插在Pi的位置k竞拍出价的边际收益cij‑Pik:Step2.3.1,根据已知不确定参数θ[θ1,θ2]的参数空间及分布概率密度函数p(θ),产生N个样本形成样本集,每个样本包含θ[θ1,θ2]和对应的f(θ)形成的有序对(θ,f(θ));其中,f(θ)为θ的具体取值下加入新任务Tj并插在Pi的位置k的优化任务束总收益;样本集分为训练集S和未采样样本集U,训练集S样本的f(θ)已通过计算获得,未采样样本集U的f(θ)未知;随机选取s个样本转入Step2.3.2计算f(θ),构造初始训练集;Step2.3.2,求需要采样的样本θk对应的优化收益f(θk):(1)对于任务时序集中的每个任务Tl∈Pi,任务Tl的执行时长已知;(2)计算Pi对应的优化执行时间
(3)求
Step2.3.3,利用MPGR方法初步筛选U,产生稀疏子集Ls:(1)利用K近邻法从U构造一个图G,每个θk是一个节点,每个节点选取离自己欧式距离最近的k个节点形成边;(2)n=1,计算图G中每个节点的度
其中,Wpq为节点p与邻居节点q的连接边权值,
其中,xp,xq是节点p,q的位置矢量,t是一个可调参数,η是所有节点的最邻近距离的平均值;(3)选出度指标最高的节点p*加入Ls,并从图G剔除
及p*的连接边;(4)若n=NLs,NLs为期望生成的Ls的规模,转入Step2.3.4;否则n自增,转入Step2.3.3的(2);Step2.3.4,通过训练集S训练高斯过程模型GPR为Jθ=J(θ),其中,J为输入不确定参数θ和输出收益Jθ之间的映射关系,高斯过程表示为J(θ)=GP(m(θ),k(θ,θ')),其中,均值m(θ)=Eθ[J(θ)],协方差k(θ,θ')=Eθ[(J(θ)‑m(θ))(J(θ')‑m(θ'))];Step2.3.5,从Ls中同时选取Ns个样本加入训练集:(1)对于每个样本θ*∈U,转入(2)进行GPR预测;(2)求预测收益分
其中,均值μ(θ*)和方差∑(θ*)的计算如下:μ(θ*)=k(θ*,θS)K‑1J(θS)
K=k(θS,θS)
其中,α和Λ为高斯训练过程的超参数;(3)选取最高评价值的Ns个样本加入训练集S,并从U中剔除
(4)若训练集规模已经达到要求,则转入Step2.3.6,否则转入Step2.3.2;Step2.3.6,计算期望收益分:(1)对于每个样本θk∈S∪U,利用式(2‑10)预测θk相应的任务收益;(2)概率归一化
(3)计算期望收益分
其中,
为无人机i增加该任务前任务束的总收益。Step2.4,从cij‑Pik中选出边际收益最大的插入位置PiG作为该任务插入到Pi中的最优时序,k=1~LPi;若cij‑Pik大于赢家出价集yij,存储cij‑PiG和PiG到无人机i的出价集
和插入时序集
代表出价过程,否则任务束构建过程结束;Step2.5,从Ci中选择边际收益最大的任务
作为新加任务,更新无人机i的信息结构:![]()
Step2.6,若无人机的任务束已经溢出,则任务束构建过程结束,更新分配时间标记tip;步骤3,无人机i进行收敛判断,若Tip‑tip≥Nu,Nu为通信网络直径,则无人机i的分配信息已经保持Nu通信循环不变,若所有无人机的分配信息已经保持不变,则编队达到分配结果一致状态,算法结束;步骤4,各无人机之间进行同步通信,共享zi,yi并更新分配时间标记Tip,若无人机i接收到邻接无人机l分配的信息后,对目标j的任务Tj,信息更新行动规则如下:(1)更新:把ylj赋值给yij,把zlj赋值给zij;(2)重置:yij置为0,zij置为空;(3)离开:yij、zij保持不变;步骤5,各无人机经过一致性协商‑竞标过程后,无人机i更新Bi,Pi,对于任务Tl∈Bi,若
则从任务束中剔除该任务Tl及Bi中位于该任务后加入的任务;步骤6,优化目标函数![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910513324.8/,转载请声明来源钻瓜专利网。





