[发明专利]一种基于电力审计制度的无监督知识图谱构建方法在审
申请号: | 202110829109.6 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113360680A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 赵张莉;杨燕;崔艺馨;郝磊;崔霞;李博 | 申请(专利权)人: | 国网天津市电力公司;国家电网有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/31;G06F40/205;G06F40/253;G06F40/295;G06F40/30 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王来佳 |
地址: | 300010*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电力 审计 制度 监督 知识 图谱 构建 方法 | ||
1.一种基于电力审计制度的无监督知识图谱构建方法,其特征在于,包括以下步骤:
步骤1、定义电力审计法律制度文档关键信息的抽取规则;
步骤1.1、定义三元组类型与内容;
步骤1.2、根据定义的三元组生成正则表达式;
步骤2、抽取三元组:基于步骤1中生成的正则表达式以及输入的审计制度,采用无监督方法自动提取法律制度文档中的关键信息;
步骤3、构建知识图谱:基于步骤2中提取的三元组形式的法律制度文档中的关键信息,根据实体和关系构建知识图谱并保存,同时对关键信息进行上下文编码得到稠密的低维向量语义表示。
2.根据权利要求1中的一种基于电力审计制度的无监督知识图谱构建方法,其特征在于:所述步骤1中,电力审计法律制度文档关键信息抽取规则根据相关法律制度文档的特征,总结关键信息的特点并分类,定义“实体1-关系-实体2”三元组的内容,生成描述三元组的正则表达式。
3.根据权利要求2中的一种基于电力审计制度的无监督知识图谱构建方法,其特征在于:所述三元组的正则表达式包括以下几种模式:
模式1:法律,施行时间,对应施行时间;
模式2:法律,废止时间,对应废止时间;
模式3:法律,下属条目,对应法律第n条内容;
模式4:审计领域词汇,定义,对应定义内容;
模式5:审计领域事件,包含,对应事件包含内容。
4.根据权利要求1中的一种基于电力审计制度的无监督知识图谱构建方法,其特征在于:所述步骤2中,三元组抽取使用无监督的特征模板方法,根据正则表达式提取电力审计相关法律制度文件中的三元组信息。
5.根据权利要求1中的一种基于电力审计制度的无监督知识图谱构建方法,其特征在于:所述步骤3中,知识图谱构建根据抽取得到的三元组信息生成知识图,其中实体采用节点表示,关系采用带有方向的边来表示,并对关键信息进行上下文编码得到稠密的低维向量语义表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网天津市电力公司;国家电网有限公司,未经国网天津市电力公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110829109.6/1.html,转载请声明来源钻瓜专利网。