[发明专利]用于实体对齐的方法及装置、电子设备在审
申请号: | 202210337904.8 | 申请日: | 2022-04-01 |
公开(公告)号: | CN114676267A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 刘伟硕 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295 |
代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 陶俊洁 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 实体 对齐 方法 装置 电子设备 | ||
本申请涉及实体对齐技术领域,公开一种用于实体对齐的方法,包括:在知识图谱中确定第一待对齐实体和第二待对齐实体;构建第一集合、第二集合和第三集合;第一集合包括第一待对齐实体、第一待对齐实体对应的关系和第一待对齐实体对应的实体,第二集合包括第二待对齐实体、第二待对齐实体对应的关系和第二待对齐实体对应的实体,第三集合包括第一待对齐实体和第二待对齐实体共有的关系和实体;根据第一集合、第二集合和第三集合获取第一概率和第二概率;根据第一概率和第二概率判断第一待对齐实体和第二待对齐实体是否为同一对象,从而提高了实体对齐的准确率。本申请还公开一种用于实体对齐的装置及电子设备。
技术领域
本申请涉及实体对齐技术领域,例如涉及一种用于实体对齐的方法及装置、电子设备。
背景技术
不同的知识图谱,收集知识的侧重点不同。对于同一个实体,有知识图谱的可能侧重于其本身某个方面的描述,有的知识图谱可能侧重于描述实体与其它实体的关系。通过知识融合可以将不同知识图谱中的知识进行互补融合,形成全面、准确、完整的实体描述。知识融合过程中,主要涉及到的工作就是实体对齐。通过实体对齐可以判断两个不同信息来源的实体是否为指向真实世界中同一个对象。
在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:
现有技术中仅根据两个实体分别对应的关系对齐矩阵和实体对齐矩阵的相似度判断两个实体是否为同一对象,这样的实体对齐方式准确率不高。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于实体对齐的方法及装置、电子设备,以提高实体对齐的准确率。
在一些实施例中,所述用于实体对齐的方法包括:在知识图谱中确定第一待对齐实体和第二待对齐实体;构建第一集合、第二集合和第三集合;所述第一集合包括所述第一待对齐实体、所述第一待对齐实体对应的关系和所述第一待对齐实体对应的实体,所述第二集合包括所述第二待对齐实体、所述第二待对齐实体对应的关系和所述第二待对齐实体对应的实体,所述第三集合包括所述第一待对齐实体和所述第二待对齐实体共有的关系和实体;根据所述第一集合、所述第二集合和第三集合获取第一待对齐实体和第二待对齐实体为同一对象的第一概率,和,第一待对齐实体和第二待对齐实体不是同一对象的第二概率;根据第一概率和第二概率判断第一待对齐实体和第二待对齐实体是否为同一对象。
在一些实施例中,用于实体对齐的装置包括:确定模块,被配置为在知识图谱中确定第一待对齐实体和第二待对齐实体;集合构建模块,被配置为构建第一集合、第二集合和第三集合;第一集合包括第一待对齐实体、第一待对齐实体对应的关系和第一待对齐实体对应的实体,第二集合包括第二待对齐实体、第二待对齐实体对应的关系和第二待对齐实体对应的实体,第三集合包括第一待对齐实体和第二待对齐实体共有的关系和实体;概率获取模块,被配置为根据第一集合、第二集合和第三集合获取第一待对齐实体和第二待对齐实体为同一对象的第一概率,和,第一待对齐实体和第二待对齐实体不是同一对象的第二概率;判断模块,被配置为根据第一概率和第二概率判断第一待对齐实体和第二待对齐实体是否为同一对象。
在一些实施例中,电子设备,包括处理器和存储有程序指令的存储器,处理器被配置为在运行程序指令时,执行如上述的用于实体对齐的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210337904.8/2.html,转载请声明来源钻瓜专利网。