[发明专利]一种用于智能仓储机器人系统的分布式多机器人路径规划方法有效
申请号: | 202110077352.7 | 申请日: | 2021-01-20 |
公开(公告)号: | CN112925307B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 郑彬;陈林;赵永廷;王小军;孙小勇;高鹏;肖剑 | 申请(专利权)人: | 中国科学院重庆绿色智能技术研究院 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400714 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 智能 仓储 机器人 系统 分布式 路径 规划 方法 | ||
1.一种用于智能仓储机器人系统的分布式多机器人路径规划方法,其特征在于:在格子地图工作空间中运行机器人,将机器人状态输入到DQN神经网络中产生动作,通过动作作用于环境中,得到下一个时刻的状态和奖励,所述奖励包括引导机器人从初始位置行驶至终止位置并且行驶的过程中尽量减少转换方向的第一部分奖励,以及指导机器人在行驶的过程中避免与其他机器人的碰撞的第二部分奖励;
第i个机器人的奖励rikT包括第一部分奖励(gr)ikT和第二部分奖励(cr)ikT:
对于第一部分奖励(gr)ikT,如公式(5)所示,当机器人的位置到达目标位置时奖励设置为rarrival=1;当机器人的上一个动作为(0,v)和(0,-v)并且没有到达目标位置时,y轴方向的相对位置的奖励权重设置大于x轴方向,其中w2w1;当机器人的上一个动作为(v,0)和(-v,0)并且没有到达目标位置时,x轴方向的相对位置的奖励权重设置大于y轴方向,其中w1w2,其中w1为x轴方向的相对位置的奖励权重,w2为y轴方向的相对位置的奖励权重;
其中sakT为上一个时刻机器人执行的动作;
对于第二部分奖励(cr)ikT如公式(6)所示,当两个机器发生碰撞的时候设置一个负的奖励rcollision=-1;
其中D代表机器人的边长为D。
2.根据权利要求1所述的用于智能仓储机器人系统的分布式多机器人路径规划方法,其特征在于:机器人在kT时刻的状态为skT,T为机器人以速度v移动一个格子所需要的时间;状态skT包括三部分,第一部分为激光雷达扫描周围360°距离的数据sokT,第二部分为当前机器人相对于目标的位置sgkT,第三部分为上一个时刻机器人执行的动作sakT;
3.根据权利要求1所述的用于智能仓储机器人系统的分布式多机器人路径规划方法,其特征在于:根据机器人工作的格子地图工作空间,机器人在kT时刻的动作空间As包含五个动作,分别为前进、后退、往左、往右和停止;在kT时刻机器人将状态输入DQN神经网络得到动作akT;
akT~πθ(akT|skT),k=0,1,2,... (2)
As={(v,0),(-v,0),(0,v),(0,-v),(0,0)} (3)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院重庆绿色智能技术研究院,未经中国科学院重庆绿色智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110077352.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种化工油乳化设备
- 下一篇:一种分拣机器人夹具用定位夹紧装置