[发明专利]一种用于智能仓储机器人系统的分布式多机器人路径规划方法有效
申请号: | 202110077352.7 | 申请日: | 2021-01-20 |
公开(公告)号: | CN112925307B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 郑彬;陈林;赵永廷;王小军;孙小勇;高鹏;肖剑 | 申请(专利权)人: | 中国科学院重庆绿色智能技术研究院 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400714 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 智能 仓储 机器人 系统 分布式 路径 规划 方法 | ||
本发明涉及一种用于智能仓储机器人系统的分布式多机器人路径规划方法,属于多机器人自动控制技术领域,在格子地图工作空间中,将机器人状态输入到DQN神经网络中产生动作,通过动作作用于环境中,得到下一个时刻的状态和奖励,所述奖励包括引导机器人从初始位置行驶至终止位置并且行驶的过程中尽量减少转换方向的第一部分奖励,以及指导机器人在行驶的过程中避免与其他机器人的碰撞的第二部分奖励。本发明利用DQN训练算法得到一个策略,该策略可以很好的指导机器人在智能仓储空间中从它的初始位置行驶至目标位置,在行驶的过程中,能够避免与其他机器人碰撞。并且尽量减少机器人在行驶的过程中转换方向,提高机器人完成任务的效率。
技术领域
本发明属于多机器人自动控制技术领域,涉及一种用于智能仓储机器人系统的分布式多机器人路径规划方法。
背景技术
智能仓储空间中通常布置有几十甚至上百台机器人,这些机器人通常是24小时连续不断地运输商品。目前,大多数智能仓储系统都采用的是集中式控制方法,中央服务器掌握全部环境信息以及各受控机器人的信息,运用规划算法、优化算法,中央对任务进行分解和分配,向各受控机器人发布命令,组织多个受控机器人共同完成任务。该方法严重依赖于机器人与中央控制器之间的通信,一旦中央控制器出现问题,那么整个智能仓储机器人系统将会瘫痪。该方法的灵活性差,当系统中机器人的个数增加或减少时,原有的规划结果无效,需重新规划。该方法的适应性差,中央服务器在复杂多变的环境中无法保证各受控机器人快速地响应外界的变化,做出适当的决策。因此该结构不适合动态、开放的环境。
发明内容
有鉴于此,本发明的目的在于基于深度强化学习DQN网络,提供一种新的应用于智能仓储机器人系统的分布式多机器人路径规划算法。本发明利用DQN训练算法得到一个策略,该策略可以很好的指导机器人在智能仓储空间中从它的初始位置行驶至目标位置,在行驶的过程中,能够避免与其他机器人碰撞。并且尽量减少机器人在行驶的过程中转换方向,提高机器人完成任务的效率。
为达到上述目的,本发明提供如下技术方案:
一种用于智能仓储机器人系统的分布式多机器人路径规划方法,在格子地图工作空间中运行机器人,将机器人状态输入到DQN(Deep Q Network)神经网络中产生动作,通过动作作用于环境中,得到下一个时刻的状态和奖励,所述奖励包括引导机器人从初始位置行驶至终止位置并且行驶的过程中尽量减少转换方向的第一部分奖励,以及指导机器人在行驶的过程中避免与其他机器人的碰撞的第二部分奖励。
进一步,机器人在kT时刻的状态为skT,T为机器人以速度v移动一个格子所需要的时间;状态skT包括三部分,第一部分为激光雷达扫描周围360°距离的数据sokT,第二部分为当前机器人相对于目标的位置sgkT,第三部分为上一个时刻机器人执行的动作sakT;
进一步,根据机器人工作的格子地图工作空间,机器人在kT时刻的动作空间As包含五个动作,分别为前进、后退、往左、往右和停止;在kT时刻机器人将状态输入DQN神经网络得到动作akT;
akT~πθ(akT|skT),k=0,1,2,... (2)
As={(v,0),(-v,0),(0,v),(0,-v),(0,0)} (3)。
进一步,第i个机器人的奖励rikT包括第一部分奖励(gr)ikT和第二部分奖励(cr)ikT:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院重庆绿色智能技术研究院,未经中国科学院重庆绿色智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110077352.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种化工油乳化设备
- 下一篇:一种分拣机器人夹具用定位夹紧装置