[发明专利]一种基于强化学习的多组机器人协作控制方法及控制系统有效
| 申请号: | 201811077944.3 | 申请日: | 2018-09-16 |
| 公开(公告)号: | CN109116854B | 公开(公告)日: | 2021-03-12 |
| 发明(设计)人: | 陈春林;王岚;刁敏敏;唐开强;任其成;王子辉;朱长青;辛博 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G05D1/02 | 分类号: | G05D1/02 |
| 代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
| 地址: | 210093 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供了一种基于强化学习的多组机器人协作控制方法及系统。方法步骤包括:强化学习生成状态动作表、组内各个机器人彼此共享强化学习结果、相遇时分享状态动作表生成全环境状态动作集合以及利用全环境状态动作集合来对各组机器人进行协作控制。系统包括环境建图模块、组内学习共享模块、组间学习共享模块以及协作控制模块。该多组机器人协作控制方法及系统通过强化学习算法学习出单个机器人在相应状态下的动作,并以此为基础,进行组内交互,共享一个机器人组的学习效果,最终在组间机器人相遇时,共享所有组内信息,并进行机器人避让,提高强化学习的效率;利用组间多机器人迁移学习机制,提高在大面积空间下的多机器人导航效率。 | ||
| 搜索关键词: | 一种 基于 强化 学习 机器人 协作 控制 方法 控制系统 | ||
【主权项】:
1.一种基于强化学习的多组机器人协作控制方法,其特征在于,包括如下步骤:步骤1,对机器人所处环境进行栅格化处理得到环境栅格,使得通道信息转化为有限状态集合,由各组机器人根据有限状态集合对所处环境进行强化学习生成状态动作表;步骤2,组内各个机器人彼此共享强化学习结果;步骤3,组间机器人相遇时进行避让控制,并分享各自组内的状态动作表,确定当前状态下机器人选择的动作,从而进一步生成全环境状态动作集合;步骤4,利用生成的全环境状态动作集合来对各组机器人进行协作控制。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811077944.3/,转载请声明来源钻瓜专利网。
- 上一篇:基于工具车的自主导航系统及工具车
- 下一篇:一种移动小车循迹控制方法及系统





