[发明专利]用于实体对齐的方法及装置、电子设备在审
申请号: | 202210337904.8 | 申请日: | 2022-04-01 |
公开(公告)号: | CN114676267A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 刘伟硕 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295 |
代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 陶俊洁 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 实体 对齐 方法 装置 电子设备 | ||
1.一种用于实体对齐的方法,其特征在于,包括:
在知识图谱中确定第一待对齐实体和第二待对齐实体;
构建第一集合、第二集合和第三集合;所述第一集合包括所述第一待对齐实体、所述第一待对齐实体对应的关系和所述第一待对齐实体对应的实体,所述第二集合包括所述第二待对齐实体、所述第二待对齐实体对应的关系和所述第二待对齐实体对应的实体,所述第三集合包括所述第一待对齐实体和所述第二待对齐实体共有的关系和实体;
根据所述第一集合、所述第二集合和所述第三集合获取所述第一待对齐实体和所述第二待对齐实体为同一对象的第一概率,和,所述第一待对齐实体和所述第二待对齐实体不是同一对象的第二概率;
根据所述第一概率和所述第二概率判断所述第一待对齐实体和所述第二待对齐实体是否为同一对象。
2.根据权利要求1所述的方法,其特征在于,根据所述第一集合、所述第二集合和所述第三集合获取所述第一待对齐实体和所述第二待对齐实体为同一对象的第一概率,和,所述第一待对齐实体和所述第二待对齐实体不是同一对象的第二概率,包括:
获取所述第一待对齐实体的向量表示,获取所述第二待对齐实体的向量表示;
获取所述第一集合对应的实体对齐矩阵,获取所述第一集合对应的关系对齐矩阵;
获取所述第二集合对应的实体对齐矩阵,获取所述第二集合对应的关系对齐矩阵;
获取所述第三集合对应的实体向量,获取所述第三集合对应的关系向量;
将各所述向量表示、各所述实体对齐矩阵、各所述关系对齐矩阵、所述实体向量和所述关系向量输入第一预设模型,获得输出向量;
将所述输出向量输入全连接层,获得所述第一概率和所述第二概率。
3.根据权利要求2所述的方法,其特征在于,获取所述第一待对齐实体的向量表示,包括:
利用第二预设模型获取所述第一待对齐实体的向量表示。
4.根据权利要求2所述的方法,其特征在于,获取所述第一集合对应的实体对齐矩阵,包括:
获取所述第一集合中的各实体与所述第二集合中所有实体之间的各最短路径长度;
将各所述最短路径长度的倒数进行归一化处理,获得所述第一集合中的各实体对应的路径向量;
根据第一预设算法对所述第一集合中的各实体对应的路径向量进行计算,获得所述第一集合中的各实体对应的实体对齐向量表示;
根据所述第一集合中的各实体对应的实体对齐向量表示获取所述第一集合对应的实体对齐矩阵。
5.根据权利要求2所述的方法,其特征在于,获取所述第一集合对应的关系对齐矩阵,包括:
获取所述第一集合中的各关系与所述第二集合中所有关系之间的各共现次数;
将各所述第一集合中的各关系对应的各所述共现次数进行归一化处理,获得所述第一集合中的各关系对应的共现次数向量;
根据第二预设算法分别对所述第一集合中的各关系对应的共现次数向量进行计算,获得所述第一集合中各所述关系对应的实体对齐向量表示;
根据所述第一集合中各所述关系对应的实体对齐向量表示获取所述第一集合对应的关系对齐矩阵。
6.根据权利要求2所述的方法,其特征在于,获取所述第三集合对应的实体向量,包括:
利用第二预设模型获取所述第三集合中各实体对应的向量表示;
获取所述第三集合中实体对应的向量表示的第一平均值,并将所述第一平均值确定为所述第三集合对应的实体向量。
7.根据权利要求2所述的方法,其特征在于,获取所述第三集合对应的关系向量,包括:
利用第二预设模型获取所述第三集合中各关系对应的向量表示;
获取所述第三集合中关系对应的向量表示的第二平均值,并将所述第二平均值确定为所述第三集合对应的关系向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210337904.8/1.html,转载请声明来源钻瓜专利网。