[发明专利]三元组的实体确认方法、装置、计算机设备和存储介质在审
| 申请号: | 202211545522.0 | 申请日: | 2022-12-05 |
| 公开(公告)号: | CN116186170A | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 陈川;刘有明;林昊;郑子彬;邬稳;王福海 | 申请(专利权)人: | 招联消费金融有限公司;中山大学 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28;G06N5/04;G06N5/02 |
| 代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 左帮胜 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 三元 实体 确认 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种三元组的实体确认方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取知识图谱中满足目标条件的多个链式规则,得到包括各链式规则的规则集;使用知识图谱表征学习和逻辑规则对规则集建模,得到可解释的推理模型;从知识图谱中获取包含已知实体和未知实体的目标三元组,使用可解释的推理模型确定与未知实体对应的候选实体;从知识图谱中获取与已知实体为同一三元组的真实实体,并基于真实实体计算候选实体的得分;根据候选实体的得分对可解释的推理模型进行优化,得到可解释的优化推理模型,并基于可解释的优化推理模型,从候选实体中确定与已知实体构成目标三元组的目标实体。采用本方法可得到三元组中缺失的实体。
技术领域
本申请涉及知识图谱技术领域,特别是涉及一种三元组的实体确认方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着互联网的快速发展,人类社会迎来了信息大爆炸的时代。为了有效地组织与管理这些零散的数据,以及从数据中获取有价值的知识,2012年谷歌正式提出了知识图谱的概念。
然而,知识图谱的构建过程并不简单,传统的方式主要靠人工手动或者半自动化地从大量的数据中抽取知识,并且通常由于数据不完整的原因,知识图谱存在许多信息缺失、关系稀疏等问题,导致原本存在某些关联的实体之间失去了它们该有的联系,从而无法对三元组中缺失的实体进行确认。
发明内容
基于此,有必要针对上述技术问题,提供一种能够对三元组中缺失的实体进行确认的三元组的实体确认方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种三元组的实体确认方法。所述方法包括:
获取知识图谱中满足目标条件的多个链式规则,得到包括各所述链式规则的规则集;
使用知识图谱表征学习和逻辑规则对所述规则集进行建模,得到可解释的推理模型;
从所述知识图谱中获取包含已知实体和未知实体的目标三元组,使用所述可解释的推理模型确定与所述未知实体对应的候选实体;
从所述知识图谱中,获取与所述已知实体属于同一三元组的多个真实实体,并基于各所述真实实体计算每一所述候选实体各自的得分;
根据每一所述候选实体的得分对所述可解释的推理模型进行优化,得到可解释的优化推理模型,并基于所述可解释的优化推理模型,从所述候选实体中确定与所述已知实体构成所述目标三元组的目标实体。
在其中一个实施例中,所述获取知识图谱中满足目标条件的多个链式规则,得到包括各所述链式规则的规则集,包括:
根据知识图谱的拓扑结构,得到所述知识图谱的多个候选链式规则;
基于所述候选链式规则的出现频率,确定满足目标条件的候选链式规则;
将所述满足目标条件的候选链式规则进行组合,得到规则集。
在其中一个实施例中,所述方法还包括:
从所述知识图谱中获取多个三元组正例样本;
对每一所述三元组正例样本中的至少一个实体进行替换,以使替换得到三元组负例样本与所述知识图谱中的链式规则不匹配;
所述使用知识图谱表征学习和逻辑规则对所述规则集进行建模,得到可解释的推理模型,包括:
基于所述三元组正例样本和所述三元组负例样本,使用知识图谱表征学习和逻辑规则对所述规则集进行建模,得到可解释的推理模型。
在其中一个实施例中,所述基于各所述真实实体计算每一所述候选实体各自的得分,包括:
确定各所述真实实体与所述候选实体的包含关系、以及所述规则集中的链式规则与所述候选实体的匹配关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招联消费金融有限公司;中山大学,未经招联消费金融有限公司;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211545522.0/2.html,转载请声明来源钻瓜专利网。





