[发明专利]一种基于演示轨迹的机器人装配运动规划方法在审
申请号: | 202210515159.1 | 申请日: | 2022-05-12 |
公开(公告)号: | CN114800515A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 汤卿;裘方舟 | 申请(专利权)人: | 四川大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;B25J9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 演示 轨迹 机器人 装配 运动 规划 方法 | ||
本发明属于机器人自主装配领域。具体涉及一种基于演示轨迹的机器人装配运动规划方法。该方法包括以下步骤:机器人演示学习阶段:获得机器人的装配演示轨迹,机器人基于演示轨迹学习装配操作技能;多模态的表征学习阶段:机器人利用模仿学习策略引入噪声与环境交互,获得多模态的数据与标签,充分考虑机器人在运动过程中的耗能和奇异性,学习对应的多模态数据的表征;机器人强化学习阶段:基于多模态表征和演示轨迹搭建机器人轨迹规划强化学习流程,强化学习训练获得最终规划策略。本方法可以应用于包含演示装配轨迹、需要在不确定环境中实现柔顺装配任务的机器人系统中,用于提高装配任务的成功率和效率。
技术领域
本发明属于机器人智能装配领域,尤其涉及一种基于演示轨迹的机器人装配运动规划方法。
背景技术
智能制造高速发展的趋势下,精度高、速度快、重复性强的工业机器人正广泛地应用于工业生产之中。目前传统的控制方法,例如PID控制、阻抗控制,是一种利用少量自适应的手段实现沿着预先设定轨迹的柔顺机器人控制方法。但由于零件加工误差,装配时复杂的接触状态,机器人装配过程中的内在机理等因素影响,许多机器人装配任务需要较强自适应能力,仅仅依靠传统的控制方法难以完成高精度、多接触的装配任务。
近几年,基于深度强化学习控制方法在装配机器人有着越来越广泛的应用。机器人通过自主与环境交互学习具有较强自适应能力的通用控制策略。然而这种方法需要机器人通过试错进行学习,在采集数据和训练过程中存在不安全、效率低等问题,而且最后路径规划策略往往忽略机器人的耗能和运动空间奇异性等问题,在工业应用上带来了不便。
发明内容
本发明的目的是为克服已有技术的不足之处,提出一种基于演示轨迹的机器人装配运动规划方法。该方法将演示轨迹作为动态不确定环境中装配运动的参考轨迹,利用强化学习在不确定环境中的鲁棒性以及对于新环境的泛化能力,同时充分考虑机器人在运动过程中的耗能和奇异性,实现柔顺的机器人装配运动规划。旨在解决机器人在复杂、时变、非结构化环境中的轨迹规划与控制问题。本发明提出了一种基于演示轨迹的机器人装配运动规划方法。该方法包括以下步骤。
1)机器人演示学习阶段:获得机器人的装配演示轨迹,机器人基于演示轨迹学习装配操作技能。
作为优选,所述演示轨迹获取方法为人工示教,通过示教拖动机器人的方式生成演示轨迹序列{τ1,τ2,...,τm},其中每个序列包含状态和动作序列
进一步,装配操作技能学习方法为:将演示轨迹序列抽取成新的状态动作对数据集:D={(s1,a1),(s2,a2),(s3,a3),...};构建模仿学习策略网络,将状态作为输入,动作作为标签,利用回归学得最优策略模型。
作为优选,所述策略网络由三层全连接层和Relu激活函数构成。
2)多模态的表征学习阶段:机器人利用模仿学习策略引入噪声与环境交互,获得多模态的数据与标签,充分考虑机器人在运动过程中的耗能和奇异性,学习对应的多模态数据的表征。
所述多模态数据与标签包括:固定相机获得的RGB和深度图像数据,固定在机械臂末端的力-力矩传感器数据,机械臂关节位置、速度数据,表征机器人瞬时速度的光流数据,机器人运动过程中的碰撞数据,机器人运动的耗能数据。
其中光流数据由Opencv光流算法计算获得,碰撞数据通过对力-力矩传感器读数进行分析获得,机器人运动的耗能数据通过计算电机的功率获得。
多模态表征的获取方法包括以下步骤。
2-1)对多模态原始数据进行特征提取,获得RGB图像特征、深度图像特征、力-力矩特征和机器人本体特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210515159.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高强度耐磨损硅酸钙镁板
- 下一篇:六方氮化硼及其制备方法和导热橡胶