[发明专利]基于知识图谱的快速知识对比方法及系统有效
| 申请号: | 201910025419.5 | 申请日: | 2019-01-11 |
| 公开(公告)号: | CN109885693B | 公开(公告)日: | 2021-08-03 |
| 发明(设计)人: | 李兵;熊燚铭;胡方家;陈健;赵玉琦;陈秀清 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06N3/08 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 知识 图谱 快速 对比 方法 系统 | ||
本发明提供一种基于知识图谱的快速知识对比方法及系统,包括构建知识表示单元,将各领域词条拆分解析成知识表示单元;构建知识图谱,包括将知识表示单元保存到图数据库中形成知识图谱,领域词条之间形成多对多的图结构关系;构建需对比的领域概念,包括确定需要进行比较的领域概念,拆分解析成知识表示单元,存入知识图谱并建立不破坏原图结构的临时提及关系;抽取领域概念的多级拓扑;对比多级拓扑,计算出拓扑节点权重,然后计算出领域概念的带权相似度,得到知识对比结果。本发明能够快速自动化地实现海量文献的知识对比与分类,支持复杂对比应用,实时性高,实用性强,提高后续查询融合的精度,具有重要的市场价值。
技术领域
本发明属于计算机知识对比技术领域,尤其涉及知识图谱领域知识融合的方法。
背景技术
知识图谱通过构建实体及实体关系的方式描述知识,使得知识更易在计算机之间以及计算机与人之间进行交换、流通与加工。在应用层面,不同来源的同义概念无法有效的被计算机理解,急需有效的技术方案解决以知识融合为主要目标的知识对比问题。而本专利提出一种拓扑结构提取以及对比方案,可以快速比较两个领域概念之间的同义程度。
比较结果用于指导海量文献的知识对比与分类,比如确定两个概念是否是同一概念,比如确定两个概念是否存在较高的包含关系。快速对比的实现可以节约系统资源,提高技术应用的实时性实用性,例如在医疗领域,该对比结果可支持快速自动确定某病例是否属于某领域,帮助患者快速找到相关科室。
发明内容
本发明针对现有知识对比技术中所存在的问题,提供了一种基于拓扑结构的快速对比方案。
本发明提出的技术方案是一种基于知识图谱的快速知识对比方法,包括以下步骤,
步骤1,构建知识表示单元,将各领域词条拆分解析成知识表示单元;所述知识表示单元包括领域节点AreaNode、分类节点CategoryNode和描述节点TextNode,词条各项属性保存在领域节点AreaNode中,词条所属分类保存在分类节点CategoryNode中,描述词条的详细子条目保存在描述节点TextNode中,用分词方法对属性文本和描述节点描述文本分词后,将被提及的领域节点与提及节点建立MENTION关系,其中MENTION表示提及;
步骤2,构建知识图谱,包括将步骤1所得所有知识表示单元保存到图数据库中形成知识图谱,领域词条之间形成多对多的图结构关系;
步骤3,构建需对比的领域概念,包括确定需要进行比较的领域概念A、B,将领域概念A、B拆分解析成知识表示单元,接着存入步骤2所得知识图谱并建立不破坏原图结构的临时提及关系;
步骤4,抽取领域概念的多级拓扑,包括使用子图匹配的方式抽取领域概念A、B在知识图谱上的拓扑结构,知识表示单元中的领域节点和描述节点通过MENTION关系关联的其他领域节点为该领域概念的一级拓扑,一级拓扑中领域节点直接产生MENTION关系的领域节点或通过描述节点间接产生MENTION关系的领域节点为该领域概念的二级拓扑,同理N级拓扑指N-1级拓扑直接提及的其他领域节点以及通过描述节点间接产生MENTION关系的其他领域节点,已经被提取的节点不再提取;
步骤5,对比多级拓扑,包括根据步骤4抽取的领域概念A、B的拓扑结构得到数据图,计算出拓扑节点权重,然后计算出领域概念A、B的带权相似度α,得到知识对比结果。
而且,步骤5中,基于以下定义计算拓扑节点权重,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910025419.5/2.html,转载请声明来源钻瓜专利网。





