[发明专利]基于深度学习的无人机自适应斥力系数路径规划方法有效

专利信息
申请号: 202210575347.3 申请日: 2022-05-25
公开(公告)号: CN114779821B 公开(公告)日: 2023-06-27
发明(设计)人: 曹馨文;时宏伟 申请(专利权)人: 四川大学
主分类号: G05D1/10 分类号: G05D1/10
代理公司: 暂无信息 代理人: 暂无信息
地址: 610065 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 无人机 自适应 斥力 系数 路径 规划 方法
【权利要求书】:

1.基于深度学习的无人机自适应斥力系数路径规划方法,其特征在于,包括以下步骤:

S1:生成样本集:即对于每个样本随机生成一个二维的环境障碍物地图,通过融合人工势场法与遗传算法,找出在该环境障碍物地图下最合适的正前方、左方、右方、左前方和右前方5个方向的斥力系数,最终所得样本集中每个样本包括一张环境障碍物地图,以及在该环境下最适合的正前方、左方、右方、左前方和右前方5个方向的斥力系数,具体过程包括:

S1(1)利用人工势场法进行路径规划,求得成功规划路径的长度:

S1(1.1)对无人机进行动力学建模,假设无人机安装有探测装置和速度稳定性装置,把无人机单位时间内的运动抽象成匀速直线运动,把无人机看作是WUAV*LUAV的矩形,其中WUAV表示无人机的宽度,LUAV表示无人机的长度,考虑到实际飞行情境,无人机受到以下动力学约束:

其中,γ、ψ分别为无人机某一时刻的速度、加速度和转向速度,γmax、ψmax分别为无人机的最大行驶速度、最大加速度和最大转向速度;

S1(1.2)对障碍物进行建模,通过高空全局遥感摄像头,无人机可以在路径规划之前捕捉到相关规划路径上的障碍物环境信息地图,通过将障碍物抽象成大小、位置随机的圆形来进行环境建模,生成的仿真地图的障碍物满足如下约束:

其中,r和n表示障碍物的半径和数量,rmin、rmax、nmin、nmax分别代表障碍物的最小半径、最大半径以及障碍物的最小个数和最大个数,为了提高环境地图的真实性和复杂性,障碍物可以重叠,同时假设无人机已安装传感器、摄像头,可以实时检测环境信息;

S1(1.3)初始化无人机位置,包括初始化无人机的位置、方向、速度;

S1(1.4)计算无人机在5个方向上距障碍物的距离,采用逐像素增加的方式来探测无人机在正前方、左方、右方、左前方和右前方5个方向上距离障碍物的距离,未达到与障碍物的最近距离则继续逐像素增加探测,达到与障碍物的最近距离则计算当前方向下无人机距离障碍物的距离;

S1(1.5)计算无人机距离目标点的距离,采用逐像素增加的方式来探测无人机距离目标点的距离,未到达目标点则继续逐像素增加探测,与目标点部分重叠则计算当前方向下无人机距离障碍物的距离;

S1(1.6)计算无人机受到的引力,无人机的引力势场Uatt的表达式为:

其中,katt为引力系数,d(q,qgoal)为步骤S1(1.5)中所求带正电荷的无人机q到带负电荷的目标点qgoal之间的距离,无人机离目标点的距离越远,引力势场越大,距离越近,引力势场越小,引力势场随着无人机与目标点之间的距离二次增长,根据引力势场表达式,可得出引力大小Fatt为:

S1(1.7)计算无人机受到的斥力,我们把障碍物对无人机的斥力势场简化成从正前方、左方、右方、左前方和右前方5个方向对无人机的作用,斥力势场受无人机离障碍物的距离、斥力系数和无人机当前的方向的影响,其正前方斥力势场UrepFront、左方斥力势场UrepLeft、右方斥力势场UrepRight、左前方斥力势场UrepFrontLeft和右前方斥力势场UrepFrontRight的表达式为:

有斥力合势场Urep

Urep=UrepFront+UrepLeft+UrepRight+UrepFrontLeft+UrepFrontRight    (6)

其中,dFront是无人机距前方障碍物的距离,dLeft是无人机距左方障碍物的距离,dRight是无人机距右方障碍物的距离,dFrontLeft是无人机距左前方障碍物的距离,dFrontRight是无人机距右前方障碍物之间的距离,krep1是无人机前方障碍物产生斥力的斥力系数,krep2是无人机左方障碍物产生斥力的斥力系数,krep3是无人机右方障碍物产生斥力的斥力系数,krep4是无人机左前方障碍物产生斥力的斥力系数,krep5是无人机右前方障碍物产生斥力的斥力系数,θ是无人机当下的飞行方向,无人机受到的斥力Frep为:

其中,d(q,qobs)是步骤S1(1.4)中所求无人机距障碍物的距离,d0为人为设定的一个数值,超出这个数值则视作该方向上障碍物对无人机产生的斥力为0;

S1(1.8)计算无人机受到的合力,无人机受到的合力Ftotal为:

Ftotal=Fatt+Frep      (8)

其中,Fatt为无人机受到目标点的引力,Frep为无人机受到障碍物产生的斥力之和;

S1(1.9)更新无人机位置,根据无人机的初始位置、方向、速度以及步骤S1(1.8)中所求无人机受到合力,计算出无人机当下的速度和方向,更新无人机的位置;

S1(1.10)规划合理路径,循环执行步骤S1(1.4)到步骤S1(1.9),直到无人机抵达目标点,每次更新位置所构成的路径即为规划出的最终路径;

S1(2)将步骤S1(1)中所求路径的长度作为适应度函数,通过遗传算法找出最优秀的个体,即最适合当前环境的斥力系数:

S1(2.1)编码与解码,在遗传算法中,个体的基因型和表现型之间的映射转换可通过编码和解码完成,编码是指把解空间生成路径的斥力系数映射到遗传算法搜索空间的过程,由于二进制编码的编码规则简单,在交叉和变异阶段也易于实现,设五个方向斥力系数的取值范围是[D1,D2],编码变量的二进制位数设为W,解码是指把搜索空间中个体的染色体向具体的路径规划中斥力系数的问题解转化的过程,具体是把二进制编码bi映射成斥力系数的真实值,映射过程不仅取决于二进制编码的值,也依赖于斥力系数范围[D1,D2]和二进制编码位数W,斥力系数K的解码过程为:

S1(2.2)适应度评估,把规划出来的一条路径看成遗传算法中的一个个体,适应度函数为路径的长度,路径长度越短,则表示个体的适应度越高,个体的基因越容易传递下去;

S1(2.3)选择,选择是遗传算法的核心之一,决定了遗传算法将按照怎样的规则模仿生物进化进行染色体的选择,选择算子在上一代种群中按照设定的概率选择个体组成下一代,被选中的概率由个体适应度决定,随机遍历采样方式由轮盘赌方式改进而来,更能避免选择偏差的存在,因此用随机遍历采样方式来进行选择,随机遍历采样方式采用多个选择点,只旋转一次转盘即可选出全部的个体,防止了适应度较高的个体被过多地反复选择,给了适应度较低的个体被选择的机会,选择的公平性得以保证;

S1(2.4)交叉,交叉是遗传算法的核心之一,决定了遗传算法将按照怎样的规则模仿生物进化进行基因重组,交叉算子从选择的种群中随机选择两个个体,以设定规则将两个个体的染色体进行交换,以期产生适应度更高的个体;

S1(2.5)变异,变异是遗传算法的核心之一,决定了遗传算法将按照怎样的规则模仿生物进化进行基因突变,为进化出更优秀的个体,避免遗传算法过早地陷入局部最优解,遗传算法模仿生物进化中的基因突变设置了变异机制;

S1(2.6)根据遗传算法设定的遗传代数,循环执行步骤S1(2.1)到步骤S1(2.5),最后一代的最优解即为遗传算法找出的适应当前障碍物环境的最优解;

S1(3)执行完一次上述步骤S1(1)和步骤S1(2)即获得一个样本,要得到足够步骤S2训练残差神经网络的样本集,需反复执行步骤S1(1)和步骤S1(2);

S2:利用步骤S1中所获样本集训练残差神经网络,残差神经网络的输入为环境障碍物地图,输出为该环境下最适合的正前方、左方、右方、左前方和右前方5个方向的斥力系数;

S3:通过步骤S2中训练得到的残差神经网络计算适应当前环境的5个方向的斥力系数,从而进行路径规划。

2.根据权利要求1所述的基于深度学习的无人机自适应斥力系数路径规划方法,其特征在于,步骤S2中,所述利用步骤S1中所获样本集训练残差神经网络,残差神经网络的输入为环境障碍物地图,输出为该环境下最适合的正前方、左方、右方、左前方和右前方5个方向的斥力系数,其过程包括:

S2(1)通过训练ResNet18模型来对障碍物地图进行学习,以期直接通过分析障碍物环境信息地图,找出自适应当前环境的斥力系数,从而规划出更好的路径,ResNet18由17个卷积层和一个全连接层构成,为解决深层网络不如浅层网络效果好的问题,在ResNet18中通过短路机制加入了残差单元,由于ResNet18网络深度较浅,每两个卷积层构成一个残差块,把当前残差块Li的输出作为下一个残差块Li+1的输入,有

Yi=h(Xi)+F(Xi,Wi)      (10)

Xi+1=f(Yi)      (11)

其中,Xi是当前残差块的输入,h(Xi)表示Xi的恒等映射,Yi为Xi经过两层卷积层的输出,F(Xi,Wi)为其学习到的残差,f(Yi)是Yi经激活函数relu激活后的输出,Xi+1是下一个残差块的输入,短路机制不直接从Xi学习得到Yi,而是只学习残差F(Xi,Wi),降低了学习成本,在仅作数学推导时若忽略掉激活函数relu,则从浅层Xi到深层Xi+n的学习过程为

借用链式规则,可知此学习过程的反向传播中的梯度为:

其中Loss为损失函数,由上式可得,一定不会存在梯度消失的情况,在某个残差块的学习中,最坏的情况是残差F(Xj,Wj)=0,即Yi=h(Xi),数据通过两层卷积层仅做了恒等映射,也能保证保留上一次学习到的特征;

S2(2)训练与测试模型,在寻找最优解的训练过程中,损失函数采用平均平方误差,平均平方误差的计算方式为逐元素计算,计算的是残差神经网络预测的斥力系数值与样本中的斥力系数值y之差的平方和的算术平均值,元素个数用N表示,公式为:

优化器选用随机梯度下降,对每个样本都迭代更新一次,从而加快训练速度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210575347.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top