[发明专利]一种基于演示轨迹的机器人装配运动规划方法在审
申请号: | 202210515159.1 | 申请日: | 2022-05-12 |
公开(公告)号: | CN114800515A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 汤卿;裘方舟 | 申请(专利权)人: | 四川大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;B25J9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 演示 轨迹 机器人 装配 运动 规划 方法 | ||
1.本发明提出了一种基于演示轨迹的机器人装配运动规划方法,其特征在于,该方法包括以下步骤:机器人演示学习阶段:获得机器人的装配演示轨迹,机器人基于演示轨迹学习装配操作技能;多模态的表征学习阶段:机器人利用模仿学习策略引入噪声与环境交互,获得多模态的数据与标签,充分考虑机器人在运动过程中的耗能和奇异性,学习对应的多模态数据的表征;机器人强化学习阶段:基于多模态表征和演示轨迹搭建机器人轨迹规划强化学习流程,强化学习训练获得最终规划策略。
2.根据权利要求1所述的一种基于演示轨迹的机器人装配运动规划方法,其特征在于,所述演示轨迹获取方法为人工示教,通过示教拖动机器人的方式生成演示轨迹序列{τ1,τ2,...,τm},其中每个序列包含状态和动作序列
3.根据权利要求1所述的一种基于演示轨迹的机器人装配运动规划方法,其特征在于,所述装配操作技能学习具体步骤如下:1)将演示轨迹序列抽取成新的状态动作对数据集:D={(s1,a1),(s2,a2),(s3,a3),...};2)构建模仿学习策略网络,策略网络架构为三层全连接和Relu激活函数,将状态作为输入,动作作为标签,利用回归学得最优策略模型。
4.根据权利要求1所述的一种基于演示轨迹的机器人装配运动规划方法,其特征在于,所述多模态数据与标签包括:固定相机获得的RGB和深度图像数据,固定在机械臂末端的力-力矩传感器数据,机械臂关节位置、速度数据,表征机器人瞬时速度的光流数据,机器人运动过程中的碰撞数据,机器人运动的耗能数据;其中光流数据由图像处理算法可以计算获得,碰撞数据通过对力-力矩传感器读数进行分析获得,机器人运动的耗能数据通过计算电机的功率获得。
5.根据权利要求1所述的一种基于演示轨迹的机器人装配运动规划方法,其特征在于,所述多模态表征获得方式如下:
1)对多模态原始数据进行特征提取,获得RGB图像特征、深度图像特征、力-力矩特征和机器人本体特征;所述RGB图像特征包括:128*128*3的RGB图像通过VGG-16网络编码,并通过一个全连接层,得到128维高斯分布对应的128*2个特征值;所述深度图像特征包括:128*128*1的深度图像通过VGG-16网络编码,并通过一个全连接层,得到128维高斯分布对应的128*2个特征值;所述力-力矩特征包括:将32*6的力-力矩传感器时间序列读数通过步长为2的五层一维卷积编码,并通过一个全连接层,得到128维高斯分布对应的128*2个特征值;所述机器人本体特征包括:将关节位置速度通过两层多层感知机编码,得到128维高斯分布对应的128*2个特征值;
2)根据概率图模型,在已知多模态数据的情况下,各个模态间条件独立;因此可以根据下式将各个模态的估计分布融合为一个联合表征分布,
其中n表示模态数,和μj分别联合表征第j维的方差和均值;和μij则是第i个模态的单模态分布第j维的方差和均值;
3)联合表征训练还需要利用动作输入对机器人的运动做出估计,用以训练获得良好的表征;其中包括:
基于碰撞的二分类预测,用于判断机器人是否与装配件发生接触;
基于光流的反卷积解码图像预测,生成128*128*2的光流图;
基于耗能的数值预测,用于估计机器人在当前状态采用当前动作的耗能情况;
基于关节最大力矩的数值预测,用于量化估计机器人在空间的奇异化程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210515159.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高强度耐磨损硅酸钙镁板
- 下一篇:六方氮化硼及其制备方法和导热橡胶