[发明专利]知识图谱的构建方法及构建装置、电子设备在审
申请号: | 202111028832.0 | 申请日: | 2021-09-02 |
公开(公告)号: | CN113987194A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 张禄;陆斯悦;邱明泉;林华;段大鹏;王洪彪;马龙飞;赵宇彤;严嘉慧 | 申请(专利权)人: | 国网北京市电力公司;国家电网有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06F40/242;G06N3/04 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 构建 方法 装置 电子设备 | ||
本发明公开了一种知识图谱的构建方法及构建装置、电子设备。其中,该构建方法包括:获取电力业扩报装词库;基于电力业扩报装词库对业扩报装文件进行分词,得到分词结果;采用命名实体识别模型对业扩报装文件进行命名实体识别,得到命名实体识别结果;基于分词结果和命名实体识别结果,抽取业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据;基于抽取出的三元组数据和业扩报装文件,构建业扩报装知识图谱。本发明解决了相关技术中通过人工经验给出电力业扩报装的供电方案,存在编制速度慢,效率低的技术问题。
技术领域
本发明涉及信息处理技术领域,具体而言,涉及一种知识图谱的构建方法及构建装置、电子设备。
背景技术
相关技术中,随着云平台和物联网技术的快速发展,在电力行业的业扩报装工作呈现出智能化、大数据化的特征。但是,由于当前的业扩报装业务较为复杂,涉及面广,需要大量专家现场经验,人工通过现场经验给出的电力业扩报装方案,存在供电方案编制速度慢,效率低,如何有效加快供电方案编制速度,提高优质服务水平和客户满意度,提高市场影响力与占有率呈现出前所未有的紧迫感。因此需要整合业扩报装过程中各个环节资源信息,打造专有知识库,建立知识图谱体系将原本孤立存在于各个业务系统中的业务数据、流程、数据表等依照电力业务对象的业务架构关联在一起,向使用者提供全面、条理化的信息查询服务,以客户实际感知量身打造客户贴身服务成为当前业扩工作的必由之路。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种知识图谱的构建方法及构建装置、电子设备,以至少解决相关技术中通过人工经验给出电力业扩报装的供电方案,存在编制速度慢,效率低的技术问题。
根据本发明实施例的一个方面,提供了一种知识图谱的构建方法,包括:获取电力业扩报装词库;基于所述电力业扩报装词库对业扩报装文件进行分词,得到分词结果;采用命名实体识别模型对所述业扩报装文件进行命名实体识别,得到命名实体识别结果;基于所述分词结果和所述命名实体识别结果,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据;基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱。
可选地,在获取电力业扩报装词库之前,所述构建方法还包括:采用预设光学字符识别插件,对电力业扩报装的历史业务文件进行文字识别,得到文字识别结果;对所述文字识别结果进行分词处理,得到业扩报装基础词典;采用所述业扩报装基础词典,确定所述业扩报装知识图谱的实体与本体之间的关联关系。
可选地,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据的步骤,包括:采用双向长短时记忆网络Bi-LSTM,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据。
可选地,基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱的步骤,包括:基于抽取出的三元组数据和所述业扩报装文件,对所述业扩报装文件进行知识融合处理,得到融合结果;基于所述融合结果,对业扩报装数据的可信度进行量化处理,得到每个业扩报装数据的数据可信度;将数据可信度低于预设可信度阈值的业扩报装数据删除;对删除后的业扩报装数据对应的本体和实体关系按照图关联关系存储,得到所述业扩报装知识图谱。
可选地,基于抽取出的三元组数据和所述业扩报装文件,对所述业扩报装文件进行知识融合处理,得到融合结果的步骤,包括:基于抽取出的三元组数据和所述业扩报装文件,根据预先设置的实体指称项,通过相似度计算将指称项链接到正确的实体对象;根据实体的指称、属性、关系以及所属类别,进行数据层融合处理;在完成数据层融合处理后,进行模式层融合处理,得到的业扩报装本体库;将所述业扩报装本体库融入已有的本体库中,得到融合结果。
可选地,在基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱之后,所述构建方法还包括:采用预设图形数据库存储构建完成的所述业扩报装知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网北京市电力公司;国家电网有限公司,未经国网北京市电力公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111028832.0/2.html,转载请声明来源钻瓜专利网。