[发明专利]设备故障序列模式的挖掘方法及装置有效
| 申请号: | 201710648158.3 | 申请日: | 2017-08-01 |
| 公开(公告)号: | CN107391727B | 公开(公告)日: | 2020-03-06 |
| 发明(设计)人: | 常文兵;李磊;雷景淞;肖依永;周晟瀚 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/332;G06F40/289;G06F40/247 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王宁宁 |
| 地址: | 100083*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 设备 故障 序列 模式 挖掘 方法 装置 | ||
1.一种设备故障序列模式的挖掘方法,其特征在于,包括:
获取故障文本的相似度矩阵,其中,所述故障文本包括多条故障文本,所述故障文本为用于描述至少一个设备的故障信息的文本,所述相似度矩阵中包括任意两个故障文本之间的相似度;
基于所述相似度矩阵在所述故障文本中提取频繁项目集;
在所述频繁项目集中进行故障序列模式的挖掘,得到目标故障序列模式集;
其中,在所述频繁项目集中进行故障序列模式的挖掘,得到目标故障序列模式集包括:
统计故障序列模式的支持度和共现度,其中,所述支持度用于表示所述故障序列模式在全部设备中发生的总次数,所述共现度用于表示所述故障序列模式在多少台设备中发生过,所述故障序列模式表示发生第一条故障之后发生第二条故障,所述第一条故障和所述第二条故障为所述频繁项目集中的任意两条故障;
在所述支持度大于第三阈值,且所述共现度大于第四阈值的情况下,将所述故障序列模式作为所述目标故障序列模式集中的元素。
2.根据权利要求1所述的方法,其特征在于,获取故障文本的相似度矩阵包括:
获取待处理的所述故障文本;
对所述故障文本进行分词处理;
利用向量空间模型对执行所述分词处理之后的所述故障文本进行格式转化,转化成采用向量空间模型方法所表示的中间故障文本;
基于所述中间故障文本构建TF-IDF模型,其中,所述TF-IDF模型中包括所述中间故障文本中每个词语的TF-IDF值;
基于所述TF-IDF模型确定所述相似度矩阵。
3.根据权利要求2所述的方法,其特征在于,基于所述中间故障文本构建TF-IDF模型包括:
基于所述中间故障文本统计所述故障文本中每个词语的词频,其中,所述词频表示所述词语在所述故障文本中出现的次数;
基于所述中间故障文本计算所述故障文本中每个词语的逆文档频率;
结合所述词频和逆文档频率计算每个词语的TF-IDF值;
基于所述每个词语的TF-IDF值构建所述TF-IDF模型。
4.根据权利要求3所述的方法,其特征在于,基于所述中间故障文本计算所述故障文本中每个词语的逆文档频率包括:
通过公式计算词语ti的所述逆文档频率,其中,所述|D|表示所述故障文本中的文本数量,dj为所述故障文本中表示包含所述词语ti的文本,idfi为所述词语ti的所述逆文档频率。
5.根据权利要求4所述的方法,其特征在于,基于所述每个词语的TF-IDF值构建所述TF-IDF模型包括:
通过公式tfidfi,j=tfi,j×idfi计算所述词语ti的TF-IDF值,其中,tfidfi,j为所述词语ti的TF-IDF值,tfi,j为所述词语ti的词频;
通过公式对所述词语ti的TF-IDF值进行归一化处理,得到处理之后的TF-IDF值。
6.根据权利要求1所述的方法,其特征在于,所述相似度矩阵包括多个行向量,基于所述相似度矩阵在所述故障文本中提取频繁项目集包括:
统计行向量Ak中相似度值大于或者等于第一阈值的数量,k依次取1至N,N为所述故障文本的数量;
判断数量是否大于或者等于第二阈值;
如果判断出是,则将所述行向量Ak所对应的故障文本作为所述频繁项目集中的一个元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710648158.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加载系统页面的方法和装置
- 下一篇:数据挖掘方法以及数据挖掘装置





