[发明专利]一种电网调度故障处理知识图谱的构建方法及装置有效
| 申请号: | 202010552327.5 | 申请日: | 2020-06-17 |
| 公开(公告)号: | CN111860882B | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 李杰;梁文腾;李艺丰;严晴;谢峰;李红;李昊;张韬;旷文腾;李子祺 | 申请(专利权)人: | 国网江苏省电力有限公司;国网电力科学研究院有限公司;国电南瑞科技股份有限公司;国家电网有限公司 |
| 主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06Q10/06;G06Q50/06;G06F40/295;G06N3/04;G06N3/08 |
| 代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 张赏 |
| 地址: | 211106 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 电网 调度 故障 处理 知识 图谱 构建 方法 装置 | ||
1.一种电网调度故障处理知识图谱的构建方法,其特征在于,包括:
对电网调度故障处理领域文本语料进行专业短语识别,包括:将故障预案、运行方式和调度日志的领域语料进行中文分词;采用N-Gram频次统计模型构建短语字典树节点,得到频次大于预设值的短语序列,作为候选短语;基于候选短语的统计指标特征进行高质量候选短语筛选;所述高质量候选短语是指频次高,但对于电网调度故障处理领域不重要的短语;计算高质量候选短语的质量评分;基于高质量候选短语的质量评分对中文分词后的故障预案、运行方式和调度日志的领域语料进行迭代切割,最终识别出电网调度故障处理领域专业短语;
对识别后的电网调度故障处理领域专业短语进行命名实体识别,包括:对电网调度故障处理领域专业短语进行语料标注,标注出厂站,设备,事件和操作,一行一个分词以及对应的标注符号;将语料标注后生成的标注信息转换为BIO标注格式;对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理;将数据增强和预处理后的专业短语划分训练集和验证集,以Albert-zh模块作为文本特征提取,采用Bi-LSTM序列标注算法进行模型训练与验证,得到电网调度故障处理领域中厂站、设备、事件和操作的命名实体识别模型;
所述对语料标注后的电网调度故障处理领域专业短语进行数据增强和预处理,包括:对电网调度故障处理领域专业短语中的分句进行bigram、trigram拼接,生成新的分句;对于已标注为厂站、设备、事件和操作的实体,利用收集到的命名实体词典,采用随机替换的方式,替换同类型的实体,得到增强语料;对所有语料去除空行与句号,统一符号状态,统一字母大小写,以及去掉无意义的词;
对命名实体识别后的电网调度故障处理领域专业短语进行实体关系抽取并融合,构建多领域融合的电网调度故障处理知识图谱。
2.根据权利要求1所述的一种电网调度故障处理知识图谱的构建方法,其特征在于,所述基于候选短语的统计指标特征进行高质量候选短语筛选,包括:
将候选短语按照9:1的比例划分训练集和验证集,并人工标注出训练集中高质量候选短语;
针对每一个人工标注样本,采用决策树分类器进行训练、测试与验证,构建基于短语统计指标特征的分类器,用于识别高质量候选短语;所述统计指标特征包括:候选短语的值、值、PMI值、左邻字熵和右邻字熵。
3.根据权利要求1所述的一种电网调度故障处理知识图谱的构建方法,其特征在于,所述计算高质量候选短语的质量评分,包括:
;
其中,为候选短语的质量评分,、、、、分别为候选短语的值、值、PMI值、左邻字熵、右邻字熵,、、、、分别为候选短语的值、值、PMI值、左邻字熵、右邻字熵值的权重。
4.根据权利要求1所述的一种电网调度故障处理知识图谱的构建方法,其特征在于,所述基于高质量候选短语的质量评分对中文分词后的故障预案、运行方式和调度日志的领域语料进行迭代切割,最终识别出电网调度故障处理领域专业短语,包括:
将高质量候选短语按质量评分从大到小进行排序,获取质量评分最大的前N个高质量候选短语;
对中文分词后的故障预案、运行方式和调度日志的领域语料基于前N个高质量候选短语进行迭代切割,更新候选短语,并重新计算更新后的候选短语的统计指标特征和质量评分,直至最终的候选短语的质量评分不变,输出最终质量评分最大的前N个候选短语,作为电网调度故障处理领域专业短语。
5.根据权利要求1所述的一种电网调度故障处理知识图谱的构建方法,其特征在于,还包括:
在已识别的厂站和设备中,基于名称缩写文本模式,识别厂站和设备的同义词与缩略词,共同作为电网调度故障处理知识图谱构建的实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司;国网电力科学研究院有限公司;国电南瑞科技股份有限公司;国家电网有限公司,未经国网江苏省电力有限公司;国网电力科学研究院有限公司;国电南瑞科技股份有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010552327.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





