[发明专利]一种不确定环境下的分布式多无人机任务分配方法有效
| 申请号: | 201910513324.8 | 申请日: | 2019-06-14 |
| 公开(公告)号: | CN110134146B | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 符小卫;王辉;潘静;高晓光 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G05D1/10 | 分类号: | G05D1/10 |
| 代理公司: | 西北工业大学专利中心 61204 | 代理人: | 顾潮琪 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 不确定 环境 分布式 无人机 任务 分配 方法 | ||
1.一种不确定环境下的分布式多无人机任务分配方法,其特征在于包括下述步骤:
步骤1,对于由Na个无人机组成的无人机编队,所有无人机均是同一类型;任务执行区域内有Nt个目标,无人机编队要对每个目标执行时敏任务,每个时敏任务的执行时间为tj,j=1,2...,Nt,其时间窗约束为ETj≤tj≤LTj,其中,ETj为任务j的最早允许开始执行时间,LTj为任务j的最晚允许开始执行时间;
无人机i对目标j执行任务的收益其中,Vj为目标j的价值,λ为指数折扣收益模型的递减因子,α为距离代价的惩罚因子,Lij为无人机i与目标j的欧式距离;
每个任务的执行时长tj-dur=gj(θ),其中,任务环境的不确定参数θ服从分布概率密度函数p(θ),函数关系gj在仿真时由历史数据或模型仿真获得;
协同分配模型目的是求解决策矩阵x,xij=1表示分配无人机i对目标j执行任务,Na为组成无人机编队的无人机的数量;
每个无人机最多能够执行Li个任务,每个无人机维护以下数据信息结构:
(1)任务束集(Bundle):其中bin是竞拍到的目标,表示无人机i竞拍得到的第n个任务的序号;
(2)任务时序集(Path):任务时序Pi为无人机i的任务束Bi的任务执行顺序,即无人机i执行任务的顺序为
(3)执行时间集(Time):τin∈R+表示无人机i根据任务时序集Pi到达任务区执行任务pin的执行时间;
(4)赢家集(Winning Uavs):其中元素zin表示无人机i与其所有邻接无人机通过信息交互所获得的关于任务j的赢家信息,即当前时刻无人机zin对任务j出价最高成为赢家;若当前尚未有无人机竞拍到任务j,则zi=φ;
(5)赢家出价集(Winning Bids):其中元素yin∈R+,用来表示当前时刻各无人机对任务j竞拍时的最大出价值,若当前尚未有无人机竞拍到任务j则yin=0;
(6)时间戳集(Time Stamps):时间戳为其中元素sin∈R+,用来表示无人机i与其邻接无人机之间的最近一次信息交互时间;
(7)分配时间标记:[Tip,tip],Tip为通信的时间标记,无人机之间采用同步通信机制,每次协商阶段无人机i同通信网络中的其他所有无人机进行完通信,Tip自增;tip为无人机i进行任务束构建阶段的时间标记,无人机i任务束构建完有新任务加入时,tip自增;
步骤2,已知无人机i和目标j的位置矢量、目标j任务Tj的价值和时间窗,构造信息结构Bi,Pi,τi的步骤如下:
Step2.1,从j=1循环迭代到j=Nt,若执行Step2.2到Step2.6,否则j自增;
Step2.2,对于任务时序集Pi的每一个位置k=1到k=LPi,检测加入新任务Tj的可能性,若满足可能性转入Step2.3,LPi为无人机i的任务时序集里已经出价的任务个数;
Step2.3,求Tj插在Pi的位置k竞拍出价的边际收益cij-Pik:
Step2.3.1,根据不确定参数θ的参数空间及分布概率密度函数p(θ),产生N个样本形成样本集,每个样本包含不确定参数θ和对应的f(θ)形成的有序对(θ,f(θ));其中,θ为二维参数[θ1,θ2],f(θ)为θ的具体取值下加入新任务Tj并插在Pi的位置k的优化任务束总收益;
样本集分为训练集S和未采样样本集U,训练集S样本的f(θ)已通过计算获得,未采样样本集U的f(θ)未知;
随机选取s个样本转入Step2.3.2计算f(θ),构造初始训练集;
Step2.3.2,求需要采样的样本θk对应的优化收益f(θk):
(1)对于任务时序集中的每个任务Tl∈Pi,任务Tl的执行时长已知;
(2)计算Pi对应的优化执行时间
(3)求
Step2.3.3,初步筛选U,产生稀疏子集Ls:
(1)利用K近邻法从U构造一个图G,每个θk是一个节点,每个节点选取离自己欧式距离最近的k个节点形成边;
(2)n=1,计算图G中每个节点的度其中,Wpq为节点p与邻居节点q的连接边权值,其中,xp,xq是节点p,q的位置矢量,t是一个可调参数,η是所有节点的最邻近距离的平均值;
(3)选出度指标最高的节点p*加入Ls,并从图G剔除及p*的连接边;
(4)若n=NLs,NLs为期望生成的Ls的规模,转入Step2.3.4;否则n自增,转入Step2.3.3的(2);
Step2.3.4,通过训练集S训练高斯过程模型GPR为Jθ=J(θ),其中,J为输入不确定参数θ和输出收益Jθ之间的映射关系,高斯过程表示为J(θ)=GP(m(θ),k(θ,θ')),其中,均值m(θ)=Eθ[J(θ)],协方差k(θ,θ')=Eθ[(J(θ)-m(θ))(J(θ')-m(θ'))];
Step2.3.5,从Ls中同时选取Ns个样本加入训练集:
(1)对于每个样本θ*∈U,转入(2)进行GPR预测;
(2)求预测收益分其中,均值μ(θ*)和方差∑(θ*)的计算如下:
μ(θ*)=k(θ*,θS)K-1J(θS)
K=k(θS,θS)
其中,α和Λ为高斯训练过程的超参数;
(3)选取最高评价值的Ns个样本加入训练集S,并从U中剔除
(4)若训练集规模已经达到要求,则转入Step2.3.6,否则转入Step2.3.2;
Step2.3.6,计算期望收益分:
(1)对于每个样本θk∈S∪U,利用Step2.3.5中第(2)步中的公式预测θk相应的任务收益;
(2)概率归一化
(3)计算期望收益分
其中,为无人机i增加该任务前任务束的总收益;
Step2.4,从cij-Pik中选出边际收益最大的插入位置PiG作为该任务插入到Pi中的最优时序,k=1~LPi;若cij-Pik大于赢家出价集yij,存储cij-PiG和PiG到无人机i的出价集和插入时序集代表出价过程,否则任务束构建过程结束;
Step2.5,从Ci中选择边际收益最大的任务作为新加任务,更新无人机i的信息结构:
Step2.6,若无人机的任务束已经溢出,则任务束构建过程结束,更新分配时间标记tip;
步骤3,无人机i进行收敛判断,若Tip-tip≥Nu,Nu为通信网络直径,则无人机i的分配信息已经保持Nu通信循环不变,若所有无人机的分配信息已经保持不变,则编队达到分配结果一致状态,算法结束;
步骤4,各无人机之间进行同步通信,共享zi,yi并更新分配时间标记Tip,若无人机i接收到邻接无人机l分配的信息后,对目标j的任务Tj,信息更新行动规则如下:
(1)更新:把ylj赋值给yij,把zlj赋值给zij;
(2)重置:yij置为0,zij置为空;
(3)离开:yij、zij保持不变;
步骤5,各无人机经过一致性协商-竞标过程后,无人机i更新Bi,Pi,对于任务Tl∈Bi,若则从任务束中剔除该任务Tl及Bi中位于该任务后加入的任务;
步骤6,优化目标函数
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910513324.8/1.html,转载请声明来源钻瓜专利网。





