[发明专利]机器学习装置、控制装置以及机器学习方法在审
| 申请号: | 201910926693.X | 申请日: | 2019-09-27 |
| 公开(公告)号: | CN111082729A | 公开(公告)日: | 2020-04-28 |
| 发明(设计)人: | 恒木亮太郎;猪饲聪史;白川佑贵 | 申请(专利权)人: | 发那科株式会社 |
| 主分类号: | H02P23/00 | 分类号: | H02P23/00;G06N20/00 |
| 代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 曾贤伟;范胜杰 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 机器 学习 装置 控制 以及 学习方法 | ||
1.一种机器学习装置,其进行对设置于伺服控制装置的至少一个滤波器的系数进行优化的机器学习,所述伺服控制装置控制电动机的旋转,其特征在于,
所述滤波器是使特定的频率成分衰减的滤波器,
所述机器学习装置根据测量装置的测量信息来优化所述滤波器的系数,其中,所述测量装置根据所述伺服控制装置中频率变化的输入信号和输出信号,测量所述伺服控制装置的输入输出增益和输入输出的相位延迟中的至少一个。
2.根据权利要求1所述的机器学习装置,其特征在于,
所述频率变化的输入信号是频率变化的正弦波,
该正弦波由频率生成装置生成,该频率生成装置设置于所述伺服控制装置内或所述伺服控制装置外。
3.根据权利要求1或2所述的机器学习装置,其特征在于,
所述机器学习装置具有:
状态信息取得部,其取得包含所述测量信息和所述滤波器的系数在内的状态信息;
行为信息输出部,其向所述滤波器输出行为信息,该行为信息包含在所述状态信息中包含的所述系数的调整信息;
回报输出部,其输出基于所述测量信息的强化学习中的回报值;以及
价值函数更新部,其根据由所述回报输出部输出的回报值、所述状态信息、所述行为信息来更新行为价值函数。
4.根据权利要求3所述的机器学习装置,其特征在于,
所述测量信息包含所述输入输出增益和所述输入输出的相位延迟,
当所述测量信息中包含的所述伺服控制装置的输入输出增益是根据所述伺服控制装置的特性计算出的输入输出增益的标准模型的该输入输出增益以下时,所述回报输出部计算基于所述输入输出的相位延迟的回报。
5.根据权利要求4所述的机器学习装置,其特征在于,
所述标准模型的输入输出增益在规定的频率以上是固定值。
6.根据权利要求4或5所述的机器学习装置,其特征在于,
所述回报输出部计算回报以使所述输入输出的相位延迟变小。
7.根据权利要求3~6中任一项所述的机器学习装置,其特征在于,
所述机器学习装置具有:优化行为信息输出部,其根据由所述价值函数更新部更新了的价值函数来输出所述系数的调整信息。
8.一种控制装置,其特征在于,具有:
权利要求1~7中任一项所述的机器学习装置;
伺服控制装置,其具有使特定的频率成分衰减的至少一个滤波器,所述伺服控制装置控制电动机的旋转;以及
测量装置,其根据所述伺服控制装置中频率变化的输入信号和输出信号,测量所述伺服控制装置的输入输出增益和输入输出的相位延迟中的至少一个。
9.一种机器学习装置的机器学习方法,该机器学习装置进行对设置于伺服控制装置的至少一个滤波器的系数进行优化的机器学习,所述伺服控制装置控制电动机的旋转,所述滤波器使特定的频率成分衰减,其特征在于,
根据测量装置的测量信息来优化所述滤波器的系数,其中,所述测量装置根据所述伺服控制装置中频率变化的输入信号和输出信号,测量所述伺服控制装置的输入输出增益和输入输出的相位延迟中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于发那科株式会社,未经发那科株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910926693.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:费托衍生物流的醚化
- 下一篇:电子设备、文本处理方法以及记录有程序的记录介质





