[发明专利]基于强化学习的旋转机械诊断网络自动搜索方法有效
申请号: | 202110234810.3 | 申请日: | 2021-03-03 |
公开(公告)号: | CN113031441B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 王艺玮;周健;郑联语 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 李冉 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 旋转 机械 诊断 网络 自动 搜索 方法 | ||
1.基于强化学习的旋转机械诊断网络自动搜索方法,其特征在于,包括以下步骤:
S1、定义包含六种网络层的操作空间,设计最大十二层的状态空间;
S2、创建控制器,根据子模型当前拓扑状态做出决策,逐层从操作空间选择网络层搭建子模型,利用给定数据训练验证子模型并保存精度;
所述步骤S2中的子模型搭建存在规则;
所述子模型 搭建规则为每轮搜索开始,控制器逐层进行搜索决策,当该层确定了操作类型后便添加输出层创建子模型,这里有两种情况,1)当搜索到全连接层,会在前面添加一个展平层将三维的中间张量降为二维,那么创建子模型时添加的输出层只需要一层全连接层即可,其神经元数同目标数据集的状态数,激活函数为Softmax;2)当搜索到其它层时,添加的输出层则包含展平层和全连接层,每轮搜索的终止条件为:1)搜索到了Dense;2)模型深度超过了12层;
所述步骤S2中子模型的训练过程中设置了权值共享;
所述权值共享即相同网络层在不同子模型训练过程中共享权值,网络层的权值数量与自身参数有关,也与输入张量有关,在子模型的训练过程中,对各网络层进行命名,将影响参数数量的因素考虑进去,格式为”类型_参数_激活函数_输入张量维度”,这样,在每次创建完子模型后,按照子模型各网络层的命名检索网络库,将同名网络层的权值参数赋予新创建的子模型,之后继续训练子模型;
所述步骤S2具体为:
S21、使用三层全连接网络层搭建控制器和副控制器,输出层的激活函数采用Relu;
S22、将子模型当前拓扑状态输入至控制器,预测子模型下一层网络类型及其回报值;
S23、根据预测结果从操作空间选择网络类型搭建新的子模型;
S24、用给定数据训练验证子模型并保存验证精度;
S3、根据子模型验证精度得到当前奖励值,将奖励值转化为回报,保存子模型拓扑结构和回报值,强化训练控制器优化其参数;
S4、子模型和控制器交替训练,最终得到能针对具体问题高效搜索出具有良好诊断性能子模型的控制器,解决旋转机械状态诊断问题。
2.如权利要求1所述的基于强化学习的旋转机械诊断网络自动搜索方法,其特征在于,所述步骤S1中的操作空间有六种网络层供搜索,包括三种卷积网络层、最大池化层、随机失活层和全连接层。
3.如权利要求1所述的基于强化学习的旋转机械诊断网络自动搜索方法,其特征在于,所述步骤S1中的状态空间即子模型在搜索搭建过程中的结构变化。
4.如权利要求1所述的基于强化学习的旋转机械诊断网络自动搜索方法,其特征在于所述步骤S2中的控制器由三层全连接网络层搭建。
5.如权利要求1所述的基于强化学习的旋转机械诊断网络自动搜索方法,其特征在于所述步骤S2中的子模型拓扑状态即子模型12层的操作类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110234810.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高层建筑用混凝土的施工泵送装置
- 下一篇:一种带热管的电池模组