[发明专利]用于控制物理系统的设备和方法在审
申请号: | 202111121351.4 | 申请日: | 2021-09-24 |
公开(公告)号: | CN114253131A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | F·伯肯坎普;J·斯皮茨;K·斯库布奇;L·格罗斯伯格;S·法尔科纳;A·埃瓦齐 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G05B13/04 | 分类号: | G05B13/04;G06N3/04;G06N3/08;G06N7/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 杜荔南;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 控制 物理 系统 设备 方法 | ||
1.一种用于控制物理系统的方法,所述方法具有:
分别响应于所述物理系统的控制配置的输入和任务输入参数的值的输入,针对多个由所述物理系统执行的任务,训练神经网络来输出所执行的任务的结果;
其中所述训练具有:确定所述神经网络的权重,并且针对所执行的任务中的每个任务确定所述任务输入参数的值;
借助于贝叶斯优化来确定针对另一任务的控制配置,其中执行对控制配置的依次评估,其中在每次评估的情况下都针对相应的控制配置确定执行所述另一任务的结果;
其中通过按照概率分布来分布的任务输入参数来被参数化的所述神经网络被用作控制配置与结果之间的关系的模型,而且在使用所述评估的情况下依次被更新,其方式是根据所述评估来调节所述任务输入参数的概率分布;而且
按照所述控制配置来控制所述物理系统以执行所述另一任务。
2.根据权利要求1所述的方法,其中利用损失函数通过监督学习来执行对所述神经网络的训练,所述损失函数取决于所述神经网络的权重和针对所执行的任务的任务输入参数的值。
3.根据权利要求1或2所述的方法,其中所述损失函数具有正则化项,所述正则化项引起:针对所执行的任务来被训练的所述任务输入参数的值的经验分布近似预先给定的概率分布。
4.根据权利要求3所述的方法,其中所述预先给定的概率分布是高斯分布。
5.根据权利要求1至4中任一项所述的方法,其中根据所述评估来调节针对所述另一任务的任务输入参数的概率分布,其方式是使对其来说所述神经网络的输出更接近由所述评估所提供的结果的任务输入参数值的概率相对于对其来说所述神经网络的输出不那么接近由所述评估所提供的结果的任务输入参数值的概率而言提高。
6.根据权利要求1至5中任一项所述的方法,其中所述物理系统具有一个或多个致动器,而且按照所述控制配置来控制所述物理系统以执行所述另一任务具有:按照通过所述控制配置给出的控制参数值来控制所述一个或多个致动器。
7.根据权利要求1至6中任一项所述的方法,其中所述控制配置具有由所述物理系统所实现的机器学习模型的超参数。
8.根据权利要求1至7中任一项所述的方法,其中所述另一任务是对数字图像的图像分类或者对产品的生产。
9.一种控制装置,所述控制装置被设立为实施根据权利要求1至8中任一项所述的方法。
10.一种计算机程序,其具有程序指令,当所述程序指令由一个或多个处理器来实施时,所述程序指令使所述一个或多个处理器执行根据权利要求1至8中任一项所述的方法。
11.一种计算机可读存储介质,在其上存储有程序指令,当所述程序指令由一个或多个处理器来实施时,所述程序指令使所述一个或多个处理器执行根据权利要求1至8中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111121351.4/1.html,转载请声明来源钻瓜专利网。