[发明专利]一种基于深度学习的端到端的机械臂控制的方法有效
申请号: | 201611203287.3 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106737673B | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 刘勇;王志磊 | 申请(专利权)人: | 浙江大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;B25J13/08;B25J9/22 |
代理公司: | 浙江杭州金通专利事务所有限公司 33100 | 代理人: | 刘晓春 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 端到端 机械 控制 方法 | ||
1.一种基于深度学习的端到端的机械臂控制的方法,其特征在于,包括如下步骤:
步骤一,以一定频率采集机械臂运动时的图像信息和机械臂的控制指令与状态信息;
步骤二,对于步骤一中采集的所述图像信息、控制指令与状态信息进行网络处理:
网络包括图像处理网络和控制策略网络,图像处理网络用于对原始图像进行降维,以使图像输入和机械臂的状态输入维度在一个量级上;
控制策略网络输出对机械臂执行的控制指令,初始化图像处理网络的权重,图像信息作为输入,机械臂的状态信息作为输出,训练初始化图像处理网络;初始化控制策略网络的权重,机械臂的状态信息作为输入,控制指令作为输出,训练初始化控制策略网络的网络权重;
步骤三,在有障碍物的场景中,在采集数据的阶段得到障碍物的位置信息,人工示教机械臂绕过障碍物同时到达目标位置;移动障碍物,改变障碍物的位置,重复上述操作多次,采集多条避障的轨迹;在执行轨迹的过程中记录图片和控制指令;对步骤二所获的网络进行训练,该过程实际上是对网络的权重进行调整优化;
步骤四,对于步骤三采集的每条避障轨迹加入一定的噪声,使机械臂能够在示教轨迹的周围进行探索,探索到一条最优轨迹,在执行最优轨迹的过程中记录图片和控制指令;
然后将采集的图片和控制指令当作训练数据,对步骤二所获得初始网络进行进一步调参训练。
2.如权利要求1所述的一种基于深度学习的端到端的机械臂控制的方法,其特征在于,在训练过程中,端到端的训练是指从图像获得机械臂控制指令的方式。
3.如权利要求1所述的一种基于深度学习的端到端的机械臂控制的方法,其特征在于,步骤三中,将目标物体放置在几个不同的位置,控制机械臂对目标物体进行抓取,以一定的频率记录机械臂的状态信息,包括关节角、机械臂末端执行机构的位置、末端执行机构姿态及机械臂的控制力矩,将机械臂的关节角及末端执行机构的位姿作为输入,机械臂的力矩信息作为输出来训练控制策略网络,以此作为控制策略网络的初始化。
4.如权利要求1所述的一种基于深度学习的端到端的机械臂控制的方法,其特征在于,步骤四中,将图片信息所表达的环境进行降维,将低维表达作为控制策略网络的一部分输入,构建出网络的端到端模式,对机械臂的执行设置一个目标函数,在运动过程中,反复对机械臂的运动轨迹进行优化,在该优化过程中采集到的数据作为网络的训练数据,从而实现对已经初始化的网络进行参数调整,即轨迹优化过程中采集的数据仍然作为训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611203287.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电脑防沉迷装置
- 下一篇:仪表盘非线性刻度视觉检测方法及画写系统装置