[发明专利]一种基于深度强化学习的越野车三维路径规划方法在审

专利信息
申请号: 202211034787.4 申请日: 2022-08-26
公开(公告)号: CN115357022A 公开(公告)日: 2022-11-18
发明(设计)人: 袁小芳;侯明心;黄国明;王金磊;谭伟华;王耀南 申请(专利权)人: 湖南大学
主分类号: G05D1/02 分类号: G05D1/02
代理公司: 长沙市护航专利代理事务所(特殊普通合伙) 43220 代理人: 莫晓齐
地址: 410082 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 强化 学习 越野车 三维 路径 规划 方法
【权利要求书】:

1.一种基于深度强化学习的越野车三维路径规划方法,其特征在于,所述方法包括以下步骤:

S1、构建一个基于价值的越野车三维路径规划的深度卷积神经网络模型,以最优动作价值函数为学习目标;

S2、构建随越野车移动的动态全局地图作为观测输入;

S3、综合考虑所述动态全局地图中越野车的路程与能耗设计奖励函数,计算越野车在当前状态下执行动作后获得的奖励值;

S4、根据目标距离设计深度强化学习的探索策略,用于控制越野车在当前状态下执行动作的类型;

S5、结合所述探索策略和所述奖励函数对所述深度卷积神经网络模型进行端到端的训练,以使越野车从起点到终点的行驶过程中获得的奖励最大,实现越野车的三维路径规划。

2.如权利要求1所述的基于深度强化学习的越野车三维路径规划方法,其特征在于,所述最优动作价值函数具体为:

式中,Q*(s,a)是深度卷积神经网络模型的最优动作价值,E表示期望值,S表示越野车的状态空间,A表示越野车的动作空间,at表示越野车在t时刻的动作,st表示越野车在t时刻的状态,Ut表示越野车在t时刻的累积奖励。

3.如权利要求2所述的基于深度强化学习的越野车三维路径规划方法,其特征在于,所述步骤S1中的深度卷积神经网络的损失函数为:

式中,L(θ)表示损失值,E表示期望值,p是状态转移函数,表示深度卷积神经网络在t+1时刻做出的预测,θ表示深度卷积神经网络的参数。

4.如权利要求1所述的基于深度强化学习的越野车三维路径规划方法,其特征在于,所述步骤S1中的深度卷积神经网络模型包括依次连接的输入层、第一卷积主干层、最大池化层、第二卷积主干层、第一全连接层和第二全连接层,所述第一全连接层由所述第二卷积主干层引出两个分支,一个分支经所述第一全连接层输出预设数量个节点,用来评估方位动作,另一个分支经所述第一全连接层输出预设数量个节点,用来预测当前所处状态,最后将两个分支线性连接,经所述第二全连接层输出预设数量方位动作的Q值。

5.根据权利要求1所述的基于深度强化学习的越野车三维路径规划方法,其特征在于,所述步骤S2中构建随越野车移动的动态全局地图作为观测输入,具体包括如下步骤:

S21、设置观测输入为三层的RGB图像:设置动态全局地图尺寸为100*100,将越野车的当前位置、终点位置以及三维地图分别设置在RGB图像的不同层,采用8*8*1尺寸的图像代表越野车的当前位置,采用5*5*1尺寸的图像代表终点位置;

S22、确定步骤S21中位于第三层的地图图像:以所述越野车的当前位置与所述越野车的终点位置的连线作为对角线形成一个矩形,用该矩形在原始地图上相应位置截取地图图像,将截取后的地图图像各边界分别向外扩展,将扩展后的地图周围用0补边形成100*100*1的三维地图,以此作为第三层的地图图像;

S23、确定步骤S2中所述的观测输入:将步骤S21所述包含越野车的当前位置和终点位置的100*100*1的两层图像与步骤S22所述三维地图组合形成100*100*3的输入图像;

S24、重复步骤S22和步骤S23,随着越野车当前位置的移动获取动态全局地图作为输入图像,直至深度卷积神经网络模型训练结束。

6.根据权利要求1所述的基于深度强化学习的越野车三维路径规划方法,其特征在于,所述步骤S3的奖励函数具体为:

R=Rd+Re+Rg

式中,R表示从越野车在当前状态下执行动作获得的奖励,Rd表示距离奖励,Re表示能耗奖励,Rg表示越野车到达终点位置的奖励。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211034787.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top