[发明专利]一种设备缺陷的分类方法、装置及设备有效
申请号: | 201911309790.0 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111191447B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 谢鹏飞;崔朝辉;赵立军;张霞 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/35;G06N20/00 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 郭一斐 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 设备 缺陷 分类 方法 装置 | ||
本申请公开一种设备缺陷的分类方法、装置及设备,所述方法包括:对设备缺陷描述文本进行分词处理,得到分词结果;对分词结果进行向量化表示,得到设备缺陷描述文本对应的词向量矩阵;将词向量矩阵输入经过训练的设备缺陷分类模型,得到分类结果。本申请利用经过训练的设备缺陷分类模型对设备缺陷描述文本的词向量矩阵进行处理,得到该设备缺陷描述文本的分类结果,以表明该设备缺陷描述文本所属的设备缺陷类别。本申请基于机器学习对设备缺陷进行分类,能够提高分类效率且保证分类准确性,还可以结合基于历史数据计算的历史平均概率,以及机器学习得到的模型计算概率,确定设备缺陷描述文本的最终分类结果,进一步提高设备缺陷分类结果的准确性。
技术领域
本申请涉及数据处理领域,具体涉及一种设备缺陷的分类方法、装置及设备。
背景技术
在火电领域中,巡检员或其他员工一旦发现设备发生故障,需要记录故障现象,并由专业人员基于故障现象对故障导致的设备缺陷进行分类,以便基于分类结果及时对设备缺陷进行处理,保证设备的正常运行。
目前,对故障导致的设备缺陷进行分类的方式,主要由工作人员通常查设备缺陷分类手册等人工手段实现,显然耗时较长且准确率得不到保证。
发明内容
有鉴于此,本申请提供了一种设备缺陷的分类方法,能够通过机器学习的方式对设备缺陷进行分类,提高了分类效率以及分类结果的准确率。
第一方面,为实现上述发明目的,本申请提供了一种设备缺陷的分类方法,所述方法包括:
对设备缺陷描述文本进行分词处理,得到分词结果;
对所述分词结果进行向量化表示,得到所述设备缺陷描述文本对应的词向量矩阵;
将所述词向量矩阵输入经过训练的设备缺陷分类模型中,经过处理后,得到所述设备缺陷描述文本的分类结果。
一种可选的实施方式中,所述对设备缺陷描述文本进行分词处理,得到分词结果之后,还包括:
获取所述分词结果中的设备名称;
基于历史数据,针对每个预设缺陷类别,计算所述设备名称对应的设备的平均历史概率;
相应的,所述分类结果包括所述设备缺陷描述文本属于各个预设缺陷类别的模型计算概率;所述将所述词向量矩阵输入经过训练的设备缺陷分类模型中,经过处理后,得到所述设备缺陷描述文本的分类结果之后,还包括:
结合每个预设缺陷类别对应的平均历史概率和模型计算概率,确定所述设备缺陷描述文本的最终分类结果。
一种可选的实施方式中,所述结合每个预设缺陷类别的所述平均历史概率和所述模型计算概率,确定所述设备缺陷描述文本的最终分类结果,包括:
为所述平均历史概率和所述模型计算概率分别设置权重值;
基于所述权重值,计算所述设备缺陷描述文本属于各个预设缺陷类别的概率;
将最大概率对应的预设缺陷类别确定为所述设备缺陷描述文本的最终分类结果。
一种可选的实施方式中,所述为所述平均历史概率和所述模型计算概率分别设置权重值,包括:
基于所述历史数据的数据量,为所述平均历史概率设置权重值。
第二方面,本申请提供了一种设备缺陷的分类装置,所述装置包括:
分词模块,用于对设备缺陷描述文本进行分词处理,得到分词结果;
向量化模块,用于对所述分词结果进行向量化表示,得到所述设备缺陷描述文本对应的词向量矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911309790.0/2.html,转载请声明来源钻瓜专利网。