[发明专利]一种基于强化学习的足球机器人协作方法有效
申请号: | 201910083609.2 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109794937B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 胡丽娟;梁志伟;李汉辉 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 210046 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于强化学习的足球机器人协作方法,所述方法包括:S1、基于加入有通讯的Sarsa(λ)算法构建足球机器人的强化学习基本模型,并设定所述强化学习基本模型的奖惩机制r;S2、基于足球机器人之间的距离和角度定义指定数量的状态变量;S3、设置足球机器人的可操作动作集,足球机器人基于所述奖惩机制r和所述状态变量以及足球机器人相互间通讯选择下一步动作;本发明通过在建立的强化学习基本模型设立奖惩机制,实现足球机器人可根据当前环境和奖惩机制来选择下一动作,并且通过足球机器人相互之间的通讯来进行学习和更新,有效提升了足球机器人的协作效率。 | ||
搜索关键词: | 一种 基于 强化 学习 足球 机器人 协作 方法 | ||
【主权项】:
1.一种基于强化学习的足球机器人协作方法,其特征在于,所述方法包括:S1、基于加入有通讯的Sarsa(λ)算法构建足球机器人的强化学习基本模型,并设定所述强化学习基本模型的奖惩机制r;S2、基于足球机器人之间的距离和角度定义指定数量的状态变量;S3、设置足球机器人的可操作动作集,足球机器人基于所述奖惩机制r和所述状态变量以及足球机器人相互间通讯选择下一步动作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910083609.2/,转载请声明来源钻瓜专利网。
- 上一篇:自动上膜机械手
- 下一篇:一种适用于曲面结构的机器人制孔误差补偿装置及其方法