[发明专利]无监督学习型神经网络的无人机全区域侦察路径规划方法有效
| 申请号: | 202010234135.X | 申请日: | 2020-03-30 |
| 公开(公告)号: | CN111399541B | 公开(公告)日: | 2022-07-15 |
| 发明(设计)人: | 李波;杨志鹏;马浩;万开方;甘志刚;越凯强 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G05D1/10 | 分类号: | G05D1/10 |
| 代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 监督 学习 神经网络 无人机 区域 侦察 路径 规划 方法 | ||
1.一种无监督学习型神经网络的无人机全区域侦察路径规划方法,其特征在于包括下述步骤:
步骤1:构建环境模型、无人机模型和环境威胁约束模型:
步骤1-1:根据全覆盖路径规划的任务要求,构建环境模型;
确定无人机飞行空间{(ox,oy,oz)|0≤ox≤Xmax,0≤oy≤Ymax,0≤oz≤Zmax},其中ox、oy、oz分别表示无人机在x、y、z轴上的投影坐标,Xmax、Ymax、Zmax分别表示无人机在x、y、z轴上的最大飞行距离;
利用栅格法对环境进行建模,假设待侦察的地图范围已知,设定栅格数目为L×W/B2,其中L、W分别表示环境的最大长度和宽度,B表示栅格的长宽;
随机生成通讯信号屏蔽区和实体障碍物区作为总威胁区,覆盖至地图上;依次对地图上的每个栅格进行威胁判定:当该栅格所在的区域内威胁占比达到50%及以上时,则该栅格的所在区域全部判定为禁飞区;
步骤1-2:根据无人机机动性能,构建无人机模型;
假设无人机在侦察过程中没有复杂的空中机动,设定飞机迎角α≈0,此时sinα≈0,cosα≈1,计算无人机运动方程为:
其中,m表示无人机质量,V表示无人机合速度,T表示无人机运动时间,γ、θ、ψ分别表示无人机滚动角、俯仰角、偏航角,P、Q、Y、G分别表示无人机的发动机推力、发动机阻力、升力、重力,R表示转弯半径;
计算无人机速度:
其中,Vx、Vy、Vz分别表示无人机在x、y、z轴方向的速度,xd、yd、zd分别表示无人机在x、y、z轴方向的运动距离;设定飞机飞行高度恒定,俯仰角θ=0;
设定无人机以最大过载转弯时做无侧滑匀速盘旋运动,此时加速度得到:
设定无人机允许的最大过载为ny,结合重力加速度g,计算出飞机最小转弯半径Rmin为:
步骤1-3:构建环境威胁约束模型;
模拟随机位置产生信号屏蔽、恶劣大气、高空障碍物长方体区域作为环境威胁因素,设定环境威胁区域范围为:
其中Ω表示总威胁范围,U表示总威胁个数,Ωu表示第u个环境威胁范围,xu、yu、zu表示第u个环境威胁Ωu在x、y、z轴上的坐标范围,x'u、y'u、z'u表示第u个环境威胁在x、y、z轴上的初始坐标,分别表示第u个环境威胁在x、y、z轴上的威胁距离;
步骤2:构建无人机全覆盖路径规划评价;
步骤2-1:计算无人机有效侦察率;
用无人机的有效侦察率表示算法对无人机全区域侦察的有效性;模型模拟无人机在待侦察区域中进行高度为H的恒高飞行,分别计算除威胁区域外需侦察的总面积St和无人机侦察到的区域面积Sc,计算出无人机有效侦察率Jc为:
步骤2-2:计算无人机飞行距离;
用无人机飞行距离反映算法对无人机进行路径规划的优良性;分别计算无人机在第i个仿真步长内的飞行距离Di,得到无人机飞行总距离Dt:
其中,N表示无人机完成全区域覆盖任务总共花费的仿真步长数目;
步骤2-3:计算无人机飞行路径高频重复率;
高频重复率是反映覆盖次数高于某一阈值的方格在总的已经覆盖方格数中所占的比例,其中覆盖次数为无人机在该方格停留的仿真步长数目;计算飞行路径高频重复率Jh为:
其中,Sh表示覆盖次数高于某一阈值的面积;
步骤3:构建无人机神经网络模型和神经网络无监督学习模型;
步骤3-1:根据步骤1构建的环境模型、无人机模型和环境威胁约束模型,设定无人机最大飞行速度为Vmax,设定最大仿真步长为I;
步骤3-2:确定神经网络的输入;
设定雷达传感器个数为5,以无人机质心为中心,无人机机头方向为正前方,利用雷达传感器分别测量无人机正右方、机头偏右45°方向、正前方、机头偏左45°方向、正左方的威胁指数k1、k2、k3、k4、k5;其中:
其中,kj表示第j个雷达传感器测量的威胁指数,dj表示第j个雷达传感器测量出无人机与威胁边界的距离值,d表示雷达传感器测量范围;
分别将j个雷达传感器信号末端位置所处方格的停留步长数r1、r2、r3、r4、r5返回给无人机,记录无人机对周围方格的探索次数;
判断无人机是否进入威胁边界,计算无人机位置参数l1:
设定神经网络的输入为:
ξ=[k1 k2 k3 k4 k5 r1 r2 r3 r4 r5 l1]
步骤3-3:设定神经网络的输出为O=[FL FR],其中FL、FR分别表示无人机的左、右引擎推力;选取Sigmoid函数(S函数)作为神经网络激励函数对无人机进行连续性控制,S函数的表达式为:
其中,ys表示激励函数的输出,e为自然常数,as为神经网络的激励值,即S函数的自变量;其中,p>0,表示曲线陡峭系数;
步骤3-4:设定隐藏层中的神经网络节点数为δ,遍历输入层、隐藏层、输出层的神经元,并依次记录各相连神经元之间所对应的权值向量ωK,其中K表示向量序号,且各权值向量中的每个元素值ω∈[-1,1],整理得到神经网络参数的浮点数编码χ:
χ=[ω1 ω2 … ω2δ]
步骤3-5:计算无人机全区域覆盖适应度F:
其中,N为全区域覆盖任务总共花费的仿真步长数目,第i个仿真步长的适应度得分f为:
其中,xi、yi表示第i个仿真步长时无人机质心所在位置坐标,表示第i个仿真步长时刻无人机左、右引擎推力;
计算无人机满足威胁约束集的奖励得分c1为:
其中A为以(xi,yi)为圆心、最小半径Rmin为半径的圆,表示无人机可飞区域,Ω为全部威胁区域;
计算无人机满足机动约束集的奖励得分c2:
其中,为该时刻的转弯半径;
计算飞行到全新区域的奖励得分c3:
其中Ψ(xi,yi)表示点(xi,yi)所在栅格的无人机停留时间,b>0,表示无人机初次侦察栅格奖励系数;
步骤4:训练模型;
初始化遗传算法演化次数n=0,设定最大演化次数为Nmax,基于构建的环境模型、无人机模型和环境威胁约束模型对神经网络进行训练,优化无人机神经网络无监督学习模型;
步骤4-1:对第n代群体E(n)中的个体按适应度得分从高到低进行排序;
步骤4-2:对种群中的个体进行挑选,即选取E(n)得分最高的前β名的个体记录为精英Eβ~,其中,β表示精英数目;
步骤4-3:选择两点杂交方式,并对变异位的权值随机加上扰动值σ(σ∈(-0.5,0.5))实现变异操作,得到变异后的群体E'(n+1),对E'(n+1)中的个体按适应度得分从高到低进行排序;
步骤4-4:选取E'(n+1)得分最低的后β名的个体记录为E'~β,得到精英选择后的群体:
E(n+1)=E'(n+1)-E'~β+Eβ~
其中,E(n+1)表示经过变异、精英选择后的第n+1代群体;
当满足如下终止条件之一时,模型训练完成:
1)无人机完成全区域侦察任务或达到最大航程η;
2)遗传算法的演化次数n达到预定的最大演化次数Nmax;
步骤5:测试模型;
基于步骤4训练完成的神经网络参数对模型进行验证,观察测试过程中无人机对复杂威胁区域的规避情况,记录无人机全区域侦察覆盖率的数据变化,比较不同覆盖率下的无人机飞行路径重复率和飞行路径高频重复率变化情况,评价算法的迁移能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010234135.X/1.html,转载请声明来源钻瓜专利网。





