[发明专利]核电设备缺陷记录文本分类方法、系统、介质及电子设备在审
申请号: | 202011395959.1 | 申请日: | 2020-12-03 |
公开(公告)号: | CN112559741A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 崔妍;周勇;陈世均;张兰岐;黄立军;朱鹏树;陈星;梁永飞 | 申请(专利权)人: | 苏州热工研究院有限公司;广东核电合营有限公司;中国广核集团有限公司;中国广核电力股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 深圳市瑞方达知识产权事务所(普通合伙) 44314 | 代理人: | 冯小梅;张秋红 |
地址: | 215008 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 核电 设备 缺陷 记录 文本 分类 方法 系统 介质 电子设备 | ||
本发明公开了一种核电设备缺陷记录文本分类方法、系统、介质及电子设备,该方法包括以下步骤:S1:提取所述核电设备缺陷记录文本中多个带有电力语义信息的词向量;S2:将多个所述词向量输入BiLSTM模型后利用注意力机制为有效信息赋予不同的权重,得到最终的待分类向量;S3:将所述待分类向量经过全连接层组合后,输出至Softmax分类器中以根据所述权重进行分类。本发明提出了基于注意力机制的神经网络模型,通过该模型能够实现核电设备缺陷记录文本的自动、精准、高效分类,可以降低人为工作量,并能更快速准确地对核电设备故障进行诊断。在部分运维人员知识储备相对较少地区,可有效提高缺陷程度诊断的正确率。
技术领域
本发明涉及核电技术领域,尤其涉及一种核电设备缺陷记录文本分类方法、系统、介质及电子设备。
背景技术
在针对核电设备缺陷记录文本的相关研究中,国外已有利用机器学习的相关算法,即通过历史故障时间记录和天气数据进行设备故障预测。麻省理工学院对纽约城市电缆数万条的故障单进行组件和系统故障风险预测,从而为检修井的巡视提供了帮助。也有学者采用新颖的方法对社交网络(Twitter)中关于停电的社交数据进行挖掘,为电网停电管理提供参考。此外,由于语言形式的不同,中英文文本在分词方式以及词向量对应上有所不同,中文的预处理过程会相对复杂一些。在国内,先后有学者将传统机器学习和深度学习引入至电力设备缺陷文本挖掘领域中,并逐渐取得更优的效果,但是这些模型存在较多无义信息混淆特征向量而误分类。业内有几种方法:如将知识图谱技术应用于缺陷记录中,利用图搜索技术实现电力设备缺陷文本的检索;如将CNN应用于变压器设备缺陷文本分类,该方法首先对缺陷现象文本进行分词,再将词语向量化,输入CNN中进行训练。但是该方法仅仅对文本进行了一次串行浅层特征提取,不能很好地挖掘长文本深层语义信息;如将RNN和CNN用于变压器运维文本信息挖掘,从而取得较优的分类效果。但该模型仅仅通过CNN中的最大池化层提取特征信息,无法对特征进行注意力学习,因此仍需要对网络模型进一步优化,以实现对长文本重点语义信息的特征提取。
并且,核电厂重要设备拥有大量的设备缺陷记录文本,但是缺少系统化的利用和整理,且受限于运检人员的知识储备,常出现误分类的情况。
发明内容
本发明要解决的技术问题在于,针对现有技术的缺陷,提供一种核电设备缺陷记录文本分类方法、系统、介质及电子设备。
本发明解决其技术问题所采用的技术方案是:构造一种核电设备缺陷记录文本分类方法,包括以下步骤:
S1:提取所述核电设备缺陷记录文本中多个带有电力语义信息的词向量;
S2:将多个所述词向量输入BiLSTM模型后利用注意力机制为有效信息赋予不同的权重,得到最终的待分类向量;
S3:将所述待分类向量经过全连接层组合后,输出至Softmax分类器中以根据所述权重进行分类。
优选地,在本发明所述的核电设备缺陷记录文本分类方法中,所述步骤S1包括:
S11:对所述核电设备缺陷记录文本进行文本预处理,获得有效词语;
S12:根据所述有效词语,利用词嵌入模型得到多个带有电力语义信息的词向量。
优选地,在本发明所述的核电设备缺陷记录文本分类方法中,所述文本预处理包括:文本分词以及词汇特征提取。
优选地,在本发明所述的核电设备缺陷记录文本分类方法中,所述步骤S12包括:
S121:预构建电力设备缺陷语料库,存储缺陷语料以及对应的语料特征;
S122:利用word2vec词嵌入模型将所述有效词语映射到K维的语料特征空间,计算所述有效词语的词汇特征与所述语料特征的相关性,形成分布式词向量,从中选择正相关的词向量,得到带有电力语义信息的词向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州热工研究院有限公司;广东核电合营有限公司;中国广核集团有限公司;中国广核电力股份有限公司,未经苏州热工研究院有限公司;广东核电合营有限公司;中国广核集团有限公司;中国广核电力股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011395959.1/2.html,转载请声明来源钻瓜专利网。