[发明专利]基于知识蒸馏的知识图谱对齐方法、装置及设备在审
申请号: | 202111562165.4 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114328952A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 张勇;李昕航;李欣;李超;王霞;盛明 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62;G06N5/02;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 邢大鑫 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 蒸馏 图谱 对齐 方法 装置 设备 | ||
本发明提供一种基于知识蒸馏的知识图谱对齐方法、装置及设备,方法通过获取待对齐知识图谱集合,所述待对齐知识图谱集合包括至少两个不同的待对齐知识图谱,每个所述待对齐知识图谱中包括至少一个实体;输入所述待对齐知识图谱集合至知识图谱对齐模型,将不同的所述待对齐知识图谱中的相同实体进行对齐;其中,所述知识图谱对齐模型是基于知识图谱样本和预先确定的所述知识图谱样本中的实体标签进行训练后得到的,通过基于知识图谱对齐模型来进行实体对齐,与单纯的学习知识嵌入或邻域共识相比,在对齐过程中,知识图谱对齐模型由于结合具体的实体,能够更好地利用到关系语义信息,从而更好地实现实体对齐。
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种基于知识蒸馏的知识图谱对齐方法、装置及设备。
背景技术
在知识图谱领域,实体对齐是一项基本的任务。已有的采用嵌入式模型的方法,通常是首先学习知识图谱的嵌入表示,然后通过度量实体嵌入表示之间的相似性来进行实体的对齐。
然而,由于学习知识嵌入与邻域共识两种方法的目标不同所造成的过拟合问题,已有的方法不能很好地利用关系语义信息。
发明内容
本发明提供一种基于知识蒸馏的知识图谱对齐方法、装置及设备,用以解决现有技术中知识图谱对齐存在过拟合的缺陷,实现能够很好的利用关系语义信息进行对齐,解决过拟合的缺陷。
本发明提供一种基于知识蒸馏的知识图谱对齐方法,包括:
获取待对齐知识图谱集合,所述待对齐知识图谱集合包括至少两个不同的待对齐知识图谱,每个所述待对齐知识图谱中包括至少一个实体;
输入所述待对齐知识图谱集合至知识图谱对齐模型,将不同的所述待对齐知识图谱中的相同实体进行对齐;其中,所述知识图谱对齐模型是基于知识图谱样本和预先确定的所述知识图谱样本中的实体标签进行训练后得到的。
根据本发明提供的一种基于知识蒸馏的知识图谱对齐方法,所述知识图谱对齐模型包括输入层、中间层和输出层;
对应的,所述输入所述待对齐知识图谱集合至知识图谱对齐模型,将不同的所述待对齐知识图谱中的相同实体进行对齐,包括:
通过所述输入层将所述待对齐知识图谱集合输入至所述中间层;
通过所述中间层将所述待对齐知识图谱集合中不同的所述待对齐知识图谱中的相同实体进行对齐,得到对齐的结果;
通过所述输出层将对齐后的结果进行输出。
根据本发明提供的一种基于知识蒸馏的知识图谱对齐方法,所述中间层包括门控图卷积网络、知识嵌入网络、邻域共识网络和关系知识蒸馏网络;
所述知识图谱对齐模型的训练过程,包括:
通过所述门控图卷积网络将所述不同的所述待对齐知识图谱的图结构信息转化为向量表示;
基于所述向量表示,通过所述知识嵌入网络学习每个所述图结构信息中实体和关系的嵌入表示,得到教师网络;
基于所述向量表示,通过所述邻域共识网络学习每个所述图结构信息中实体的嵌入表示,得到学生网络;
通过所述关系知识蒸馏网络将所述教师网络中关系的嵌入表示迁移至所述学生网路中实体的嵌入表示,得到知识图谱对齐模型。
根据本发明提供的一种基于知识蒸馏的知识图谱对齐方法,所述通过所述门控图卷积网络将所述不同的所述待对齐知识图谱的图结构信息转化为向量表示,包括:
识别所述待对齐知识图谱中的实体特征矩阵;
基于前向传播和门控机制将所述实体特征矩阵中的实体信息进行传递,以将所述不同的所述待对齐知识图谱的图结构信息转化为向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111562165.4/2.html,转载请声明来源钻瓜专利网。