[发明专利]一种适用于长尾带噪分布数据的故障检测方法在审
| 申请号: | 202211435489.6 | 申请日: | 2022-11-16 |
| 公开(公告)号: | CN115688860A | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 王魏;田章豪;张乐凡 | 申请(专利权)人: | 南京大学;南京智谷人工智能研究院有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/0895;G06F17/16 |
| 代理公司: | 南京新慧恒诚知识产权代理有限公司 32424 | 代理人: | 徐彪 |
| 地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 适用于 长尾 分布 数据 故障 检测 方法 | ||
1.一种适用于长尾带噪分布数据的故障检测方法,包括以下步骤:
(一)在一个包含噪声标记且服从长尾分布的故障检测数据库选定深度神经网络模型,所述故障检测数据库包括若干个样本;
(二)结合交叉熵损失函数和正则损失Lreg在故障检测数据库内的全部训练数据上,对深度神经网络模型内的所有样本进行预定轮数的训练;
(三)基于样本的交叉熵损失值从全部训练数据中逐类选择出损失较小的样本作为干净标记数据集合,将其余的未被选中的样本的数据看作无标记数据集合,并基于筛选得到的标记数据集合和无标记数据集合生成新的伪标记数据集合;
(四)分别将交叉熵损失函数、MSE损失函数和正则损失Lreg应用于步骤(三)生成的伪标记数据集合得到模型的最终损失,并更新深度神经网络模型,同时由更新后的深度神经网络模型在干净标记数据集合中的每一类干净标记样本上的平均输出估计模型偏好矩阵;
(五)将步骤(三)和步骤(四)重复一定的轮数,并使用指数移动平均方法加权平均模型在每一轮次的偏好矩阵得到最终的模型偏好矩阵;
(六)使用步骤(三)进行样本选择并生成伪标记数据,分别将MSE损失函数、平衡损失函数和正则损失Lreg应用于生成后的伪标记数据得到最终损失并再次更新深度神经网络模型;
(七)将步骤(六)重复一定的轮数得到最终的深度神经网络模型;在测试阶段,深度神经网络模型将待测样本作为输入,并输出置信度最高的类别作为预测结果。
2.根据权利要求1所述的适用于长尾带噪分布数据的故障检测方法,其特征在于:首先对于一个包含噪声标记且服从长尾分布的故障检测数据库记数据的类别数为C,标记为c的数据子集为标记为c的样本数量为nc;选定深度神经网络模型,并记为f(·;Θ)。
3.根据权利要求1所述的适用于长尾带噪分布数据的故障检测方法,其特征在于:结合交叉熵损失函数和正则损失Lreg对深度神经网络模型进行预热,所述正则损失Lreg为下式,其中i、j、c均为类别编号
4.根据权利要求1所述的适用于长尾带噪分布数据的故障检测方法,其特征在于:步骤(三)中基于样本的交叉熵损失值的逐类样本选择过程为:
步骤100)基于当前深度神经网络模型利用交叉熵损失函数l分别计算每一类样本集合的损失值集合,记为其中
步骤101)对于任一类别c的损失值集合Lc,使用二元高斯混合模型(g1、g0)拟合其分布,得到该类别的任意样本属于均值更小的高斯分量g1的后验概率并根据后验概率的取值是否大于0.5,将该样本划分为干净标记样本或无标记样本;
步骤102)将步骤101)应用于每一类数据,得到最终的标记数据和无标记数据
5.根据权利要求1所述的适用于长尾带噪分布数据的故障检测方法,其特征在于:基于标记数据和无标记数据生成伪标记数据的过程如下:
步骤200)对每一个标记样本和无标记数据分别做K次数据增强得到
和基于深度神经网络模型和增强后的无标记数据为无标记样本生成伪标记其中T为超参数;
步骤201)令最终有伪标记数据集合
6.根据权利要求1所述的适用于长尾带噪分布数据的故障检测方法,其特征在于:将交叉熵损失函数、MSE损失函数和正则损失Lreg应用于伪标记数据集合和得到模型的整体损失并更新深度神经网络模型,其中
λu和λreg为超参数,i、j、c均为类别编号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;南京智谷人工智能研究院有限公司,未经南京大学;南京智谷人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211435489.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于血管阻塞的相关系统和方法
- 下一篇:一种管道内置式水处理装置及方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





