[发明专利]学习最优物品把持路径的机器学习装置以及机器学习方法有效
| 申请号: | 201710744542.3 | 申请日: | 2017-08-25 |
| 公开(公告)号: | CN107866809B | 公开(公告)日: | 2020-09-01 |
| 发明(设计)人: | 大场雅文 | 申请(专利权)人: | 发那科株式会社 |
| 主分类号: | B25J9/16 | 分类号: | B25J9/16 |
| 代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 范胜杰;曹鑫 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 学习 最优 物品 把持 路径 机器 装置 以及 学习方法 | ||
1.一种机器学习装置,学习用于使用把持多个物品的机械手将配置在输送装置上的多个物品收纳到容器中的机器人的运转条件,其特征在于,
该机器学习装置具备:
状态观测部,其在上述机器人的动作中观测上述多个物品的位置姿势、以及包括将上述多个物品收纳到容器中为止的周期时间、上述机器人把持物品时产生的转矩以及振动中的至少一个的状态变量;
判定数据取得部,其取得判定上述周期时间、转矩以及振动中的至少一个相对于容许值的余量的判定数据;以及
学习部,其按照通过上述状态变量以及上述判定数据的组合而构成的训练数据集来学习上述机器人的运转条件;
其中,当上述周期时间、上述转矩以及上述振动全部在上述容许值以下时,按照上述周期时间成为最小的顺序来把持上述多个物品。
2.根据权利要求1所述的机器学习装置,其特征在于,
上述周期时间是从上述机器人开始将上述多个物品收纳到容器中起直到将预定数量的物品收纳到容器中为止的时间。
3.根据权利要求1或2所述的机器学习装置,其特征在于,
根据流过驱动上述机器人的电动机的电流来计算上述转矩。
4.根据权利要求1或2所述的机器学习装置,其特征在于,
根据通过上述机械手所具备的加速度传感器检测出的加速度来计算上述振动。
5.根据权利要求1或2所述的机器学习装置,其特征在于,
上述学习部具备:
回报计算部,其根据上述判定数据来计算回报;以及
价值函数更新部,其根据上述回报来更新用于推测把持物品的顺序的价值函数,该价值函数降低上述周期时间、转矩以及振动中的至少一个。
6.根据权利要求5所述的机器学习装置,其特征在于,
上述学习部根据上述周期时间、转矩以及振动中的至少一个状态变量以及上述回报来更新与把持物品的顺序对应的行为价值表。
7.根据权利要求6所述的机器学习装置,其特征在于,
上述学习部根据与上述机器人相同结构的其他机器人的状态变量与上述回报,更新由该其他机器人将其他多个物品收纳到容器中时的周期时间、转矩以及振动中的至少一个所对应的行为价值表。
8.根据权利要求5所述的机器学习装置,其特征在于,
上述回报计算部根据上述周期时间、转矩以及振动中的至少一个来计算回报。
9.根据权利要求1或2所述的机器学习装置,其特征在于,
该机器学习装置还具备:意图决定部,其根据上述学习部按照上述训练数据集学习到的结果来决定把持上述多个物品的顺序。
10.根据权利要求1或2所述的机器学习装置,其特征在于,
上述机器学习装置经由网络与上述机器人连接,
上述状态观测部被构成为经由上述网络取得当前的状态变量。
11.根据权利要求1或2所述的机器学习装置,其特征在于,
上述机器学习装置存在于云服务器中。
12.一种机器学习方法,学习用于使用把持多个物品的机械手将配置在输送装置上的多个物品收纳到容器中的机器人的运转条件,该机器学习方法的特征在于,
在上述机器人的动作中观测上述多个物品的位置姿势、以及包括将上述多个物品收纳到容器中为止的周期时间、上述机器人把持物品时产生的转矩以及振动中的至少一个的状态变量,
取得判定上述周期时间、转矩以及振动中的至少一个相对于容许值的余量的判定数据,
按照通过上述状态变量以及上述判定数据的组合而构成的训练数据集来学习上述机器人的运转条件;
其中,当上述周期时间、上述转矩以及上述振动全部在上述容许值以下时,按照上述周期时间成为最小的顺序来把持上述多个物品。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于发那科株式会社,未经发那科株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710744542.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种五自由度工业机械手控制系统
- 下一篇:用于机器人的控制装置





