[发明专利]基于分层注意力机制的实体对齐方法及系统在审
申请号: | 201911143409.8 | 申请日: | 2019-11-20 |
公开(公告)号: | CN110929041A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 杨杨;高志鹏;郝茂杰;郭少勇;徐思雅;袁翰青;辛锐;吴军英;葛宁玲 | 申请(专利权)人: | 北京邮电大学;国网河北省电力有限公司信息通信分公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张睿 |
地址: | 100876 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分层 注意力 机制 实体 对齐 方法 系统 | ||
本发明实施例提供一种基于分层注意力机制的实体对齐方法及系统,该方法包括:将知识图谱中待实体对齐的目标实体数据进行划分,得到词级别实体数据向量和句级别实体数据向量;根据注意力机制,获取所述词级别实体数据向量之间的词向量相似度,并根据注意力机制,获取所述句级别实体数据向量之间的句向量相似度;根据所述词向量相似度,获取所述词级别实体数据向量的分配权重参数向量矩阵,并根据所述句向量相似度和杰卡德系数公式,获取所述句级别实体数据向量的分配权重参数向量矩阵,以用于对所述目标实体数据进行实体对齐。本发明实施例提高了实体对齐的准确率,使得实体向量更容易生成,有效解决实体对齐过程中先验信息不易获得的问题。
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种基于分层注意力机制的实体对齐方法及系统。
背景技术
知识图谱是用可视化技术描述知识资源及其载体的一种技术,其构建需要各种数据的支撑,但是通常这些数据的格式、存储方式以及应用场景都有所不同,因此,对多源知识融合技术的研究与整合已有知识资源势在必行。实体对齐是知识融合过程中的关键技术,其作用就在于推断来自不同知识库的不同实体是否指代现实世界中的同一客观对象,实体对齐技术实现的好坏直接影响到知识图谱的精确性和扩展性。
近年来,随着深度学习的发展,促使了知识表示学习的提出,它可以将知识图谱中的实体和关系映射到低纬空间,学习得到实体和关系的向量表示,利用该方法得到的向量不仅具备实体基本的语义信息,还包含了知识图谱的结构信息,可以从多个维度表示实体,极大的促进了实体对齐技术的发展。然而,利用深度学习的方法,在解决中文知识图谱实体对齐时,仍然存在着准确率较低,实体向量生成困难以及先验对齐数据不易获得等问题。
因此,现在亟需一种基于分层的注意力机制的实体对齐方法及系统来解决上述问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种基于分层注意力机制的实体对齐方法及系统。
第一方面,本发明实施例提供了一种基于分层注意力机制的实体对齐方法,包括:
将知识图谱中待实体对齐的目标实体数据进行划分,得到词级别实体数据向量和句级别实体数据向量;
根据注意力机制,获取所述词级别实体数据向量之间的词向量相似度,并根据注意力机制,获取所述句级别实体数据向量之间的句向量相似度;
根据所述词向量相似度,获取所述词级别实体数据向量的分配权重参数向量矩阵,并根据所述句向量相似度和杰卡德系数公式,获取所述句级别实体数据向量的分配权重参数向量矩阵,以用于对所述目标实体数据进行实体对齐。
进一步地,所述根据注意力机制,获取所述词级别实体数据向量之间的词向量相似度,包括:
根据词级别实体数据向量之间的马氏距离和相关距离,获取词级别实体数据向量之间的词向量相似度。
进一步地,所述根据词级别实体数据向量之间的马氏距离和相关距离,获取词级别实体数据向量之间的词向量相似度,包括:
根据词级别实体数据向量之间的马氏距离和相关距离,构建相似度公式,所述相似度公式为:
其中,Qw,w'表示实体描述词向量w和实体描述词向量w'之间的相似度值,S-1表示词向量w的协方差矩阵,T表示矩阵转置,a和β表示权重系数,a+β=1,0<a<1,0<β<1。
进一步地,所述根据注意力机制,获取所述句级别实体数据向量之间的句向量相似度,包括:
根据所述相似度公式,获取句级别实体数据向量中每个词向量之间的相似度;
根据句级别实体数据向量中每个词向量之间的相似度,获取句级别实体数据向量之间的句向量相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学;国网河北省电力有限公司信息通信分公司,未经北京邮电大学;国网河北省电力有限公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911143409.8/2.html,转载请声明来源钻瓜专利网。