[发明专利]机器学习装置、伺服控制系统以及机器学习方法有效

申请号：	201810444852.8	申请日：	2018-05-10
公开（公告）号：	CN108880399B	公开（公告）日：	2019-12-06
发明（设计）人：	筱田翔吾;猪饲聪史	申请（专利权）人：	发那科株式会社
主分类号：	H02P29/00	分类号：	H02P29/00
代理公司：	11243 北京银龙知识产权代理有限公司	代理人：	范胜杰;王立杰<国际申请>=<国际公布>
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	行为信息机器学习装置控制对象装置伺服控制装置电动机伺服控制系统控制器增益传输函数机器学习价值函数强化学习输出单元控制器回报调整控制器控制器输出调整信息更新单元取得单元实际动作指令输出更新
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

提供机器学习装置、伺服控制系统以及机器学习方法。根据电动机的相位适当调整控制器增益。对控制具备电动机的控制对象装置的动作的伺服控制装置进行强化学习的机器学习装置具备：行为信息输出单元，其对伺服控制装置具备的控制器输出包括控制器增益的传输函数的系数的调整信息的行为信息；状态信息取得单元，其从伺服控制装置取得状态信息，该状态信息包括在控制器根据行为信息使控制对象装置动作时被输入到控制器的指令与控制对象装置的实际动作之间的偏差、电动机的相位、控制器增益的传输函数的系数；根据状态信息中包括的偏差来输出强化学习的回报值的回报输出单元和根据回报值、状态信息、行为信息来更新行为价值函数的价值函数更新单元。

技术领域

本发明涉及用于进行伺服控制相关的机器学习的机器学习装置、伺服控制系统以及机器学习方法。

背景技术

目前，已知一种技术，通过进行伺服控制相关的机器学习，适当地控制作为伺服控制的对象的机床等。

例如在专利文献1中公开的技术中，作为状态观测关于主轴的负荷、温度以及振动。然后通过基于该观测到的状态的强化学习来学习用于修正动作指令的价值函数。学习结束后，通过使用这样学习到的价值函数，能够不需要操作员进行的修正操作而根据状况来修正动作指令。

但是，如果使伺服电动机等电动机驱动，则电动机的电感会随着电动机的相位而发生变化。因此如果用于控制电动机驱动的控制器增益为恒定，则会随着电感的变化而产生电动机的旋转不均(ムラ)。为了抑制该旋转不均，需要根据电动机的相位来调整控制器增益。

但是，在一般技术中，不根据电动机的相位来调整控制器增益。例如，在上述专利文献1公开的技术中，记载了根据负荷、温度以及振动来修正赋予机床的动作指令的情况，但是没有记载考虑电动机的相位和调整控制器增益的情况。

另外，即使假设在一般技术中调整控制器增益，电动机的电感也会根据电动机的相位在非常短的时间内瞬间变化，所以该调整并非易事。

专利文献1：日本特开平7-210207号公报

发明内容

本发明鉴于这种情况进行的，其目的为提供能够根据电动机的相位适当地调整控制器增益的机器学习装置、伺服控制系统以及机器学习方法。

(1)本发明的机器学习装置(例如后述的机器学习装置100)，针对控制具备电动机(例如后述的电动机32)的控制对象装置(例如后述的控制对象装置300)的动作的伺服控制装置(例如后述的伺服控制装置200)进行强化学习，具备：行为信息输出单元(例如后述的行为信息输出部13)，其针对上述伺服控制装置所具备的控制器(例如后述的位置控制器23、速度控制器25以及电流控制器27)输出包括控制器增益的传输函数的系数的调整信息的行为信息；状态信息取得单元(例如后述的状态信息取得部11)，其从上述伺服控制装置取得状态信息，该状态信息包括在上述控制器根据上述行为信息使上述控制对象装置进行动作时被输入到上述控制器的指令与上述控制对象装置的实际动作之间的偏差、上述电动机的相位、上述控制器增益的传输函数的系数；回报输出单元(例如后述的回报输出121)，其根据上述状态信息中包括的上述偏差来输出强化学习的回报值；以及价值函数更新单元(例如后述的价值函数更新部122)，其根据上述回报值、上述状态信息、上述行为信息来更新行为价值函数。

(2)上述(1)记载的机器学习装置可以构成为，上述伺服控制装置进行用于修正被输入到上述控制器的指令的反馈控制，上述状态信息取得单元取得被输入到上述控制器中的指令与上述反馈控制的反馈值之间的差值作为上述偏差。

(3)上述(1)或(2)记载的机器学习装置可以构成为，上述控制器是进行位置控制、速度控制以及电流控制中的任意一个的控制器的组合，该机器学习装置在将上述控制器的任意一个作为对象进行了上述强化学习后将其他控制器的一个作为对象进行上述强化学习时，可以按照进行电流控制的控制器、进行速度控制的控制器、进行位置控制的控制器的顺序设为上述强化学习的对象。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于发那科株式会社，未经发那科株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810444852.8/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H02 发电、变电或配电
H02P 电动机、发电机或机电变换器的控制或调节；控制变压器、电抗器或扼流圈
H02P29-00 用于调节或控制电动机，并适合于交流和直流电动机的装置
H02P29-02 .提供不具有电源自动切断的过负荷保护，例如监控
H02P29-04 .采用分离制动装置的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]机器学习装置、伺服控制系统以及机器学习方法有效

专利文献下载