[发明专利]实体融合方法、装置、设备及存储介质有效
| 申请号: | 201910860139.6 | 申请日: | 2019-09-11 |
| 公开(公告)号: | CN110580294B | 公开(公告)日: | 2022-11-29 |
| 发明(设计)人: | 王策;杜东 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06K9/62 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实体 融合 方法 装置 设备 存储 介质 | ||
本发明实施例提供了一种实体融合方法、装置、设备及存储介质;所述方法包括:确定待提取的目标实体;采用人工智能的特征提取模型,对样本数据中的实体进行特征提取,得到所述目标实体的目标向量和其他实体的其他向量;从所述其他向量中,查找与所述目标向量相匹配的候选向量;将所述候选向量对应的候选实体,与所述目标实体进行融合。通过样本数据中的实体向量,确定与目标实体匹配的实体,从而提高相似实体融合的准确率。
技术领域
本发明涉及机器学习领域,尤其涉及实体融合方法、装置、设备及存储介质。
背景技术
在相关技术中,知识图谱中实体融合的方法是,每个类型的实体定义一些关键属性,计算这些属性的相似度,对每个属性相似度加权求和,大于某个阈值则认为两个实体相似,将该两个实体进行融合;但是实体关键属性值存在噪音,每个来源的知识图谱实体信息准确度不能保证,导致无法融合。
发明内容
本发明实施例提供一种实体融合方法、装置、设备及存储介质,能够通过样本数据中的实体向量,确定与目标实体匹配的实体,从而提高相似实体融合的准确率。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供一种实体融合方法,包括:
确定待提取的目标实体;
对样本数据中的实体进行特征提取,得到所述目标实体的目标向量和其他实体的其他向量;
从所述其他向量中,查找与所述目标向量相匹配的候选向量;
将所述候选向量对应的候选实体,与所述目标实体进行融合。
第二方面,本发明实施例提供一种实体融合装置,包括:
第一确定模块,用于确定待提取的目标实体;
第一提取模块,用于对样本数据中的实体进行特征提取,得到所述目标实体的目标向量和其他实体的其他向量;
第一查找模块,用于从所述其他向量中,查找与所述目标向量相匹配的候选向量;
第一融合模块,用于将所述候选向量对应的候选实体,与所述目标实体进行融合。
第三方面,本发明实施例提供一种实体融合的设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现上述实体融合方法。
第四方面,本发明实施例提供一种存储介质,存储有可执行指令,用于引起处理器执行时,实现本发明实施例提供的实体融合方法。
本发明实施例具有以下有益效果:首先,确定待提取的目标实体;然后,采用人工智能的特征提取模型,对样本数据中的实体进行特征提取,得到所述目标实体的目标向量和其他实体的其他向量;从所述其他向量中,查找与所述目标向量相匹配的候选向量;最后,将所述候选向量对应的候选实体,与所述目标实体进行融合;如此,通过对样本数据进行特征提取,得到目标实体和其他实体的向量,然后,从其他向量中查找与目标向量匹配的候选向量,最后将目标实体和候选实体进行融合,提高了识别候选实体的准确度,从而提高了将不同来源的相似实体融合的准确率。
附图说明
图1是本发明实施例提供的实体融合系统的一个可选的架构示意图;
图2是本发明实施例提供的实体融合的系统的结构示意图;
图3是本发明实施例提供的实体融合方法的实现流程示意图;
图4A是本发明实施例提供的实体融合方法的另一实现流程示意图;
图4B是本发明实施例提供的实体融合方法的另一实现流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910860139.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:实体关系的存储方法及装置
- 下一篇:交通工具娱乐系统





