[发明专利]一种电力标准知识图谱构建方法、知识问答系统及装置在审
申请号: | 202211320954.1 | 申请日: | 2022-10-26 |
公开(公告)号: | CN115934955A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 周育忠;林正平;王冕;涂亮;杨宇亮 | 申请(专利权)人: | 南方电网科学研究院有限责任公司;贵州电网有限责任公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/901;G06F40/289;G06Q50/06 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 范晓翠 |
地址: | 510663 广东省广州市市辖区萝岗*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力 标准 知识 图谱 构建 方法 问答 系统 装置 | ||
本发明公开了一种电力标准知识图谱构建方法、知识问答系统及装置,包括通过采集的电力标准数据,构建电力标准知识图谱的本体结构,所述本体结构包含实体、属性及实体间关系;获取包含电力标准知识的基础数据,并对基础数据进行知识抽取,抽取出实体、属性及实体间关系;基于抽取的知识进行知识融合,并对融合后的知识进行存储,构建电力标准知识图谱。本发明针对文本信息和图像信息的知识抽取通过设计的模型有效克服了电力标准知识抽取困难的问题,不仅保证了知识抽取的可靠性,还能够保证抽取的效率。
技术领域
本发明涉及电力技术领域,特别是一种电力标准知识图谱构建方法、知识问答系统及装置。
背景技术
知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。能够把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。
基于知识图谱的应用有很多,例如智能问答、个性化推荐、知识推理、可视化等。知识问答系统与搜索引擎类似,也是一种信息检索的工具,但不同的是,知识问答系统可在语义层面理解、处理自然语言问题,并直接返回问题的答案,实现语义检索。若将知识图谱作为问答系统的知识来源,便构成了基于知识库的知识问答系统,其可接受自然语言形态的问题,通过语义分析理解问题的含义,然后在知识库中查询并返回问题的答案。
现有的电力行业的相关知识,通常还是依赖于搜索引擎,未见在此垂直领域的智能问答系统。究其原因,是由于构建电力标准知识图谱过程中,相关知识抽取难度较高,导致知识图谱构建困难。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述和/或现有的电力行业的相关知识中存在的问题,提出了本发明。
因此,本发明所要解决的问题在于如何在构建电力标准知识图谱过程中抽取相关知识。
为解决上述技术问题,本发明提供如下技术方案:
第一方面,本发明实施例提供了一种电力标准知识图谱构建方法,其包括,
通过采集的电力标准数据,构建电力标准知识图谱的本体结构,所述本体结构包含实体、属性及实体间关系;
获取包含电力标准知识的基础数据,并对基础数据进行知识抽取,抽取出实体、属性及实体间关系;
基于抽取的知识进行知识融合,并对融合后的知识进行存储,构建电力标准知识图谱。
作为本发明所述电力标准知识图谱构建方法的一种优选方案,其中:所述获取包含电力标准知识的基础数据,并对基础数据进行知识抽取包括,
对所述基础数据进行预处理,得到多个文本信息,或者得到多个文本信息和至少一个图像信息;
针对每个文本信息,将该文本信息分词后输入至Bert子模型,得到对应的向量序列,然后将所述向量序列输入至BGRU子模型中,输出用于揭示该文本信息中各个单词对应各个标签分值的状态矩阵,再将所述状态矩阵输入至CRF子模型,计算最优标签序列,实现对实体的提取和属性的提取;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网科学研究院有限责任公司;贵州电网有限责任公司,未经南方电网科学研究院有限责任公司;贵州电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211320954.1/2.html,转载请声明来源钻瓜专利网。