[发明专利]机器人三维运动空间动作模仿学习方法和系统有效
申请号: | 201910976460.0 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110900598B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 任明仑;马媛媛 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 北京久诚知识产权代理事务所(特殊普通合伙) 11542 | 代理人: | 余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器人 三维 运动 空间 动作 模仿 学习方法 系统 | ||
本发明提供一种机器人三维运动空间动作模仿学习方法和系统,涉及人工智能和机器人技术领域。本发明设计了一种基于串并联叠层BP神经网络的机器人三维空间动作模仿学习方法,将模仿学习机制应用于机器人学习系统,在模仿学习机制的流程框架下,通过将机械臂产生的示教信息传递至表示运动策略的串并联叠层BP神经网络模型来进行训练学习。通过学习运动的状态特征矩阵集合和运动的动作特征矩阵集合之间的对应关系,不仅可以再现示教动作,还能够对动作行为进行泛化,在面对不同的任务时,不需要分别进行动作规划,具有较高的智能性。
技术领域
本发明涉及人工智能技术领域,具体涉及一种机器人三维运动空间动作模仿学习方法和系统。
背景技术
随着时代的发展和人工智能的普及,以及人们对生活质量要求的提高,服务机器人特别是家庭服务机器人近年来需求增长迅速。服务机器人需要面临复杂的工作环境并且与人共享三维空间,更重要的是,这类机器人服务的对象是数量更加庞大的非专业人群。
目前,对于机器人在三维空间动作模仿学习方面的研究主要包括两个阶段,第一阶段是如何演示以及收集示教案例;第二阶段是如何从示例中获取策略并学习什么样的策略。现有技术中,在第一阶段主要采用“手把手”示教的学习形式,第二阶段采用学习状态到动作的映射策略和学习奖励函数来得到运动策略。
然而,学习状态到动作的映射策略所运用的一些方法很难运用于三维空间冗余机械臂的动作学习,学习奖励函数的方法将每个技能分开来学习,学会了模仿一个技能并不能更加快速地学习模仿下一个技能。导致目前的机器人在三维空间动作模仿学习方面的智能性较低。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种机器人三维运动空间动作模仿学习方法和系统,解决了现有技术中机器人在三维空间动作模仿学习方面智能性低的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明提供一种机器人三维运动空间动作模仿学习方法,包括以下步骤:
基于机器人的机械臂工作空间要求,划分三维运动空间;获取示教过程中的三维运动空间内的机械臂关节角角度状态信息、末端位置状态信息和特征信息;
基于所述机械臂关节角度状态信息和末端位置状态信息构建机械臂系统状态空间模型;
基于机械臂系统状态空间模型和特征信息,获取机械臂运动的状态特征矩阵集合和动作特征矩阵集合;
基于所述机械臂运动的状态特征矩阵集合、机械臂运动的动作特征矩阵集合和预先构建的串并联叠层BP神经网络模型获取动作模仿学习的串并联叠层BP神经网络模型;
获取实时目标任务的机械臂运动的状态特征矩阵集合,基于所述串并联叠层BP神经网络模型和实时目标任务的机械臂运动的状态特征矩阵集合,获取实时目标任务的机械臂运动的动作特征矩阵集合,机械臂通过关节转动,执行所述目标任务的机械臂运动的动作特征矩阵集合限定的动作。
优选的,所述特征信息包括机械臂系统状态信息和与任务相关的环境信息,其中:
机械臂系统状态信息包括机械臂当前各关节角的角度状态信息和机械臂末端点的位置状态信息;
与任务相关的环境信息包括示教任务目标点在空间坐标系中的位置状态信息。
优选的,获取机械臂运动的状态特征矩阵集合和动作特征矩阵集合步骤之前,所述方法还包括:
选取与任务相关的特征信息中的特征参数构成特征矩阵集合,对特征矩阵集合进行预处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910976460.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高导热金属基双面铝基覆铜板及其制备工艺
- 下一篇:谱峰位置的编码与解码