[发明专利]基于规则间关联的知识图谱数据扩展方法及系统有效
申请号: | 202210649331.2 | 申请日: | 2022-06-10 |
公开(公告)号: | CN114741460B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 任昭春;王梓涵;任鹏杰;陈竹敏 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/215;G06F16/2455;G06F16/2458;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 266237 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 规则 关联 知识 图谱 数据 扩展 方法 系统 | ||
本发明提供了一种基于规则间关联的知识图谱数据扩展方法及系统,其属于知识图谱表示技术领域,所述方案包括:获取待处理的知识图谱,从中抽取逻辑规则,实现规则池的构建;计算每条逻辑规则的置信度,并基于所述置信度计算逻辑规则间关联的置信度;对所述逻辑规则进行实例化,获得候选三元组,基于规则约束的优化方法计算每个候选三元组的软标签;基于所述软标签将获得的候选三元组与原始知识图谱构建为新知识图谱,基于所述新知识图谱,采用基于图神经网络的编码器获得实体表示向量,并基于表示学习的解码器获得所述新知识图谱中的关系向量表示,进行缺失三元组成立可能性预测;迭代执行上述步骤,直至满足收敛条件,获得最终的知识图谱。
技术领域
本发明属于知识图谱表示技术领域,尤其涉及一种基于规则间关联的知识图谱数据扩展方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
传统的知识图谱表示方法主要直推式地预测缺失三元组,要求所有的实体在模型训练阶段出现过。然而,在现实的场景中,知识图谱中的知识范围在不断扩大,原有知识图谱之外的实体(OOKG entities)在不断出现。例如,在著名知识图谱DBpedia中,每天都有200多个新实体出现。如图1所示,展示了原有知识图谱之外的实体出现和相关事实预测的例子,给定观察到的知识图谱,假设“太阳”这个实体是新出现的,并且存在一个辅助三元组连接原有知识图谱中的实体(observed entity)和新出现实体“太阳”,即(太阳,被围绕,行星)。接下来,基于观察到的事实和辅助三元组,目标是表示原有知识图谱之外的实体,并预测这些实体缺失的三元组(例如,(太阳,吸引,质量))。然而,为了表示这些新出现的实体,大多数传统的知识表示框架不可避免地需要重新训练模型,非常耗时。
现有方案虽然聚合了新出现实体周围的邻居信息,来表示新出现实体,但是这些框架面临严重的数据稀疏性问题;为了解决该问题,GEN和HRFN设计了元学习(metalearning)和图神经网络(graph neural network)的结合框架在元训练阶段模拟新实体出现的情况,这些方法利用了新出现实体之间的三元组,然而这些三元组往往缺失或者非常稀疏。VN网络利用逻辑规则和对称路径规则,预测新出现实体的虚拟邻居,从而缓解数据稀疏性问题;但是,发明人发现,上述方法主要建模了新出现实体一到两跳的领居结构信息,或者通过挖掘规则来增强预测效果,而忽略了很多其它的有用特征;同时,现有方法将规则置信分数(rule confidence)设为定值,或者利用启发式的规则挖掘方法,其严重忽略了规则挖掘、规则推理及表示学习三个过程之间的关系。
发明内容
本发明为了解决上述问题,提供了一种基于规则间关联的知识图谱数据扩展方法及系统,所述方案将知识图谱中逻辑规则间的关联关系引入知识图谱中新出现实体相关事实的预测中,提高了预测精确度,同时,通过对规则挖掘、规则推理、和表示学习三个过程之间的交互信息进行建模,有效提高了逻辑规则的挖掘效率和知识表示的质量。
根据本发明实施例的第一个方面,提供了一种基于规则间关联的知识图谱数据扩展方法,包括:
步骤1:获取原始知识图谱,通过对所述知识图谱进行遍历获取逻辑规则,实现规则池的构建;
步骤2:计算每条逻辑规则的置信度分数,并基于所述置信度分数计算逻辑规则间关联的置信度分数;
步骤3:对所述逻辑规则进行实例化,获得候选三元组,基于规则约束的优化方法计算每个候选三元组的软标签;其中,所述规则约束基于逻辑规则的置信度分数以及逻辑规则间关联的置信度分数确定;
步骤4:基于所述软标签将获得的候选三元组与原始知识图谱构建为新知识图谱,基于所述新知识图谱,采用基于图神经网络的编码器获得实体表示向量,并基于表示学习的解码器获得所述新知识图谱中的关系向量表示;基于所述实体表示向量及所述关系向量表示预测新知识图谱中缺失三元组成立可能性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210649331.2/2.html,转载请声明来源钻瓜专利网。