[发明专利]一种基于改进DDPG算法的移动机器人路径规划方法在审
申请号: | 202111331648.3 | 申请日: | 2021-11-11 |
公开(公告)号: | CN114089751A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 解明扬;张瀚;陈欣;王从庆;张民;陈丰毅 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 任志艳 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 ddpg 算法 移动 机器人 路径 规划 方法 | ||
1.一种基于改进DDPG算法的移动机器人路径规划方法,其特征在于,包括如下步骤:
步骤1,建立基于深度强化学习的移动机器人路径规划模型,将移动机器人路径规划问题,描述为马尔科夫决策过程;
步骤2,设计DDPG算法的状态空间、动作空间、actor网络、critic网络及奖励函数;
步骤3:对DDPG算法的经验回放池进行改进,将经验回放池划为多个不同优先级的经验回放池,移动机器人在训练过程中,根据移动机器人是否到达目标点、以及是否发生碰撞,将获取的训练数据放入不同的经验回放池中;
步骤4:设计仿真环境,移动机器人与环境进行交互,获取训练数据,采样训练数据对移动机器人进行仿真训练,完成无碰撞的路径规划。
2.根据权利要求1所述一种基于改进DDPG算法的移动机器人路径规划方法,其特征在于,步骤2中DDPG算法的状态空间包括:激光雷达数据、移动机器人当前的控制指令、移动机器人上一时刻的控制指令、目标点的方位和距离;所述移动机器人当前的控制指令是指移动机器的角速度和线速度;
DDPG算法的动作空间包括:移动机器人体坐标系下绕Z轴旋转的角速度和沿X轴的线速度。
3.根据权利要求1所述一种基于改进DDPG算法的移动机器人路径规划方法,其特征在于,步骤2中DDPG算法的奖励函数根据移动机器人是否到达目标点、移动机器人与目标点的距离变化以及是否与障碍物发生碰撞设计如下:
根据移动机器人是否到达目标点设计的奖励函数:
式中,χt为t时刻移动机器人与目标点的距离,d1为设定的阈值,当移动机器人与目标点小于d1时表示到达目标点;
根据移动机器人与障碍物是否发生碰撞设计的奖励函数:
式中,di为激光雷达检测到最近的障碍物的距离,d2为设定的常数阈值,当移动机器人与障碍物的距离小于d2时,表示与障碍物发生碰撞;
为引导移动机器人向着目标点前进,根据移动机器人与目标点之间的距离变化,设计的奖励函数:
其中,χt-1为t-1时刻移动机器人与目标点的距离,χt为t时刻移动机器人与目标点的距离;
最后总的奖励函数为:
R=rarrival+rcollision+rdis。
4.根据权利要求1所述一种基于改进DDPG算法的移动机器人路径规划方法,其特征在于,步骤4中的设计仿真环境,移动机器人与环境进行交互,获取训练数据,采样训练数据对移动机器人进行仿真训练,完成无碰撞的路径规划,具体包括如下步骤:
步骤4.1,设计仿真环境,移动机器人与环境进行交互,获取训练数据存储到经验池中;
步骤4.2,从经验池中采样获取训练数据,训练actor网络和critic网络;
步骤4.3,将移动机器人当前状态信息输入到经过训练后的策略网络中,其输出移动机器人下一步的动作指令。
5.根据权利要求1或4所述一种基于改进DDPG算法的移动机器人路径规划方法,其特征在于,步骤3中将经验回放池划为多个不同优先级的经验回放池,具体为:划为三个不同优先级的经验回放池,当移动机器人到达目标点时,将获取的训练数据放入优先级最高的经验回放池一中;当移动机器人处于正常的探索阶段时,将获取的训练数据放入优先级次之的经验回放池二中;当移动机器机器人与障碍物发生碰撞时,将获取的训练数据放入优先级最低的经验回放池三中;
所述训练数据包括状态信息、当前时刻及上一时刻的动作指令及奖励值数据,所述状态信息包括激光雷达数据、以及目标点的方位和距离信息。
6.根据权利要求4所述一种基于改进DDPG算法的移动机器人路径规划方法,其特征在于,步骤4.2中采样获取训练数据具体是按不同的比例从经验回放池中采样。
7.根据权利要求5所述一种基于改进DDPG算法的移动机器人路径规划方法,其特征在于,步骤4.2中采样获取训练数据具体是先按3:4:3的比例进行采样,训练到多个回合后,再按照4:3:3的比例从三个不同优先级的经验回放池中采样。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111331648.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电炉冶炼铆螺钢ML20制备方法
- 下一篇:挂耳式耳机