[发明专利]基于少数类过采样方法的异质不平衡数据故障检测方法有效
| 申请号: | 202010763063.8 | 申请日: | 2020-07-31 |
| 公开(公告)号: | CN111881988B | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 刘杰 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;B60T17/22 |
| 代理公司: | 北京孚睿湾知识产权代理事务所(普通合伙) 11474 | 代理人: | 王冬杰 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 少数 采样 方法 不平衡 数据 故障 检测 | ||
本发明供一种基于少数类过采样方法的异质不平衡数据故障检测方法,其包括获取机电设备健康状态相关的所监测的不平衡数据集T={T‑,T+},以等概率从少数类故障数据集T+随机选择一个样本x+;基于异质数值差异指标或平均数值型变量距离在少数类故障数据集T+中找到x+的k个近邻样本;从k个近邻样本中选择一个x+的最近邻样本基于计算人工生成样本的数值型变量和标称型变量取值;基于对机电设备进行故障检测。本发明中提出两个距离测度计算方法,所生成的少数类样本在标称型变量的取值不超出其原本的值域范围,且将标称型变量转化为数值型变量,可大大增加分类模型的选择的可能性,从而提高机电设备故障检测的准确性,并确保机电设备的安全运行。
技术领域
本发明涉及计算机仿真技术领域,特别涉及一种基于少数类过采样方法的异质不平衡数据故障检测方法。
背景技术
检测关键部件的任何可能故障对提高工程系统的安全性和可用性是非常重要的。数据驱动模型和智能传感器的发展大大扩展了故障诊断研究的应用领域。然而,不平衡数据为数据驱动故障检测方法带来很大的挑战。在不平衡数据中,某一类或少数类的数据量远远小于其它类或称多数类样本的数据量。不平衡数据往往使得数据驱动模型的最优决策面向多数类偏移,降低模型在少数类样本上的分类准确性。
在故障检测问题中,由于系统可靠性提高和故障率降低,收集到的绝大多数监测数据是关于目标系统的健康状态,而故障数据只占很小的一部分。比如,轨道卫星软件故障数据只占所有监测数据的0.41%。高铁制动系统一年间28837个监测数据中,只有159个与故障相关。因此,类间不平衡性会大大降低故障检出率和数据驱动模型的效能,这在工业中是不希望接受的。
针对不平衡数据问题所提出来的众多分类方法中,少数类过采样方法是其中重要的一类。这类方法利用真实的少数类样本生成人工少数类样本,以平衡多数类与少数类先验分布不平衡问题。
然而,目前关于不平衡数据的研究没有充分考虑异质变量对分类结果的影响。异质变量是指数据变量的类型不同。在故障诊断问题中,监测变量可能是数值型或标称型或称离散型。以汽车发动机监测参数为例,压缩比、RPM峰值、马力等是连续数值变量,而气缸数、发动机类型、燃油系统类型等是离散变量或标称型变量。在实际的故障检测问题中,异质变量问题是无法避免的。
现有少数类过采样方法在连续型数值数据上表现很好,但在处理异质不平衡数据时,往往需要将标称型数据转化为连续性数据。比如,一个取值为红、橙、黑、黄的标称型变量,可以被转化为数值为0.1、0.2、0.3、0.4的数值型变量。这种转换非常简便,但存在如下技术问题:
(1)很难确定标称型变量转化为数值型变量后的取值范围。
少数类过采样方法使用欧表达式距离为两个样本相似度的度量指标,很难确定标称型数据的取值范围。较大的取值范围会造成标称型数据在距离计算中起到主导作用。而较小的取值范围容易造成其它变量在距离计算中起主导作用。比如,假设所有数值型变量的取值范围为[0,1],若标称型变量的取值范围为[0,100],那么其在之后的距离计算中将起到主导作用。反之,若其取值范围为[0,0.1],那么数值型变量将在距离计算中起主导作用。即使可以为标称型变量确定一个合理的取值范围,其离散的本质仍然会造成离散变量两个数值间的距离与数值型变量不相同。
(2)即使可以确定标称型变量的取值范围,标称型变量的两个取值间的距离也不能令人信服。
将标称型变量转化为数值型数据后,标称型数值通常要进行排序和归一化,而这两个数据处理方式在原有的标称型变量下是不存在的。在之前的案例中,为何红色和橙色之间的距离比红色和黑色之间的距离小,同时,为何黄色比黑色‘大’。另外一个例子是设备的健康状态,可以是健康、退化和失效。这些取值是由程度大小之分,但是我们在将其转化为数值型数据后,很难确定两个值之间距离的大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010763063.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全自动模具开合模装置
- 下一篇:一种手表内容显示的方法





