[发明专利]知识图谱表示学习方法及系统有效
| 申请号: | 202011034887.8 | 申请日: | 2020-09-27 |
| 公开(公告)号: | CN112307777B | 公开(公告)日: | 2022-03-11 |
| 发明(设计)人: | 胡碧峰;侯乐;赵从志 | 申请(专利权)人: | 和美(深圳)信息技术股份有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/205;G06F16/36;G06F16/35 |
| 代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 安娜 |
| 地址: | 518040 广东省深圳市福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 图谱 表示 学习方法 系统 | ||
本发明提供一种知识图谱表示学习方法及系统,该方法包括:根据知识图谱中的三元组的首实体以及尾实体在知识图谱中的关系实体,对应确定所述首实体以及尾实体的语境信息;根据所述三元组以及所包含的首实体以及尾实体的语境信息,构建三元组树,并将所述三元组树输入到嵌入层编码,得到嵌入向量;所述嵌入向量作为正样本的实体向量与关系向量的表示;根据实体向量和关系向量之间的转化模型,通过最小化预设的评价函数,学习得到所述三元组的向量表示。本发明能利用实体的语境信息提高知识图谱表示学习的准确性。
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种知识图谱表示学习方法及系统。
背景技术
当前知识表示技术主要有两类方法,基于翻译距离的方法和基于相似度匹配的方法。基于翻译距离的方法,主要基于翻译原则,使头实体与关系之和与尾实体尽可能接近,常用欧式距离度量;基于相似度匹配的方法,主要计算头实体、关系与尾实体三者的点积,相似度越高,三者越匹配。
然而,当前知识表示技术,在训练及评估阶段,仅考虑单个三元组作为输入,没有考虑三元组中实体的语境。如实体“北京”相关的三元组包括(北京,首都,中国)、(北京,属于,文化中心),这些三元组就是实体“北京”的语境。如何利用实体的语境信息提高知识图谱表示学习的准确性成为亟待解决的问题。
发明内容
有鉴于此,本发明提供一种知识图谱表示学习方法以及方法,以利用实体的语境信息提高知识图谱表示学习的准确性。
一方面,本发明提供一种知识图谱表示学习方法,包括:
根据知识图谱中的三元组的首实体以及尾实体在知识图谱中的关系实体,对应确定所述首实体以及尾实体的语境信息;所述首实体以及尾实体的语境信息包括所述知识图谱中的三元组的首实体以及尾实体在知识图谱中的一度关系实体以及二度关系实体;
根据所述三元组以及所包含的首实体以及尾实体的语境信息,构建三元组树,并将所述三元组树输入到嵌入层编码,得到嵌入向量;所述嵌入向量作为正样本的实体向量与关系向量的表示;所述三元组树包括所述首实体、尾实体、所述首实体的一度关系实体、所述首实体的二度关系实体、所述尾实体的一度关系实体、以及所述尾实体的二度关系实体的信息;
根据实体向量和关系向量之间的转化模型,得到所述三元组数对应嵌入向量的一个评价函数,通过最小化所述评价函数,学习得到所述三元组的向量表示。
进一步地,所述嵌入层包括字符嵌入层、位置嵌入层以及分割嵌入层;所述将所述三元组树输入到嵌入层编码,得到嵌入向量的步骤包括:将所述三元组树输入到字符嵌入层编码、位置嵌入层以及分割嵌入层中的一种,得到所述嵌入向量。
进一步地,将所述三元组树输入到位置嵌入层时,得到所述嵌入向量表示为:
a,b,c,d,e,f,g,h,i,g,k,l,m;
其中,a表示所述三元组中首实体的位置编码,b表示所述三元组中关系的位置编码,c,d表示所述三元组中尾实体的位置编码,e表示所述首实体的一度关系的位置编码,f表示所述首实体的一度关系对应实体的位置编码,g表示所述首实体的二度关系的位置编码,h表示所述首实体的二度关系对应实体的位置编码,i表示所述尾实体的一度关系的位置编码,g表示所述尾实体的一度关系对应实体的位置编码,k表示所述尾实体的二度关系的位置编码,l表示所述尾实体的二度关系对应实体的位置编码。
进一步地,所述实体向量和关系向量之间的转化模型通过伯努利分布分布抽样技术,替换所述三元组的首实体或者尾实体得到负样本。
另一方面,本发明提供一种知识图谱表示学习系统,包括:语境信息获取模块,用于根据知识图谱中的三元组的首实体以及尾实体在知识图谱中的关系实体,对应确定所述首实体以及尾实体的语境信息;所述首实体以及尾实体的语境信息包括所述知识图谱中的三元组的首实体以及尾实体在知识图谱中的一度关系实体以及二度关系实体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于和美(深圳)信息技术股份有限公司,未经和美(深圳)信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011034887.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于密钥的离线换电方法及系统
- 下一篇:易固定便携式文件夹





