[发明专利]面向知识图谱多跳推理的锥嵌入方法在审
申请号: | 202110692090.5 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113449075A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 王杰;张占秋;陈佳俊 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06N3/04;G06N3/08;G06N5/04 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;付久春 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 知识 图谱 推理 嵌入 方法 | ||
1.一种面向知识图谱多跳推理的锥嵌入方法,其特征在于,包括:
步骤1,通过训练集利用梯度下降算法对查询锥嵌入模型进行训练,所述训练集为给定的一个包含若干实体的知识图谱数据集的子集;所述查询锥嵌入模型能将实体和查询表示为2维锥的笛卡尔积,并在嵌入空间中设置与、或、非算子,建模所有一阶逻辑查询;
步骤2,利用训练好的查询锥嵌入模型对一个给定查询,先将其生成锥嵌入,然后计算该锥嵌入与各个实体嵌入之间的距离,以距离最近的实体作为该查询的答案。
2.根据权利要求1所述的面向知识图谱多跳推理的锥嵌入方法,其特征在于,所述步骤2中,按以下公式将一个给定查询[[q]]生成为锥嵌入,公式为:
其中,[[q]]是仅包含与操作的查询q的答案实体;是轴嵌入;是幅角嵌入;d嵌入维数;
实体v的锥嵌入为v=(θax,0)。
3.根据权利要求2所述的面向知识图谱多跳推理的锥嵌入方法,其特征在于,对生成的所述锥嵌入的投影操作定义为:
fr(Vq)=g(MLP([θax+θax,r/2;θap+θap,r/2]))};
其中,MLP是一个保持输入维数的多层感知机网络;[·,·]是两个向量的拼接;r=(θax,r,θap,r)是d维的锥空间中为每一个关系分配一个嵌入;g是一个向量值函数其中,[g(x)]i表示g(x)的第i个元素,λ1和λ2是两个固定参数。
4.根据权利要求2所述的面向知识图谱多跳推理的锥嵌入方法,其特征在于,对生成的所述锥嵌入的与操作定义为:
其中,和分别是[[q]]和[[qi]]的锥嵌入,其中SemanticAverage是用来生成θax的函数,CardMin是用来生成θap的函数;
SemanticAverage的定义为:
θax=Arg(X,y);
其中,cos和sin分别是按向量的每个元素进行计算的余弦函数和正弦函数;ai是满足加和为1的正数;Arg是一个计算二维点角度的函数;ai通过以下方式计算:
其中,MLP是一个保持输入维数的多层感知机网络,[·,·]是两个向量的拼接,Arg通过以下方式计算:
βi=arctan([y]i/[x]i)
CardMin函数的定义为:
其中,σ是按元素的sigmoid函数,是θj,ap的第i个元素,DeepSets是如下定义的函数:
5.根据权利要求2所述的面向知识图谱多跳推理的锥嵌入方法,其特征在于,对生成的所述锥嵌入的或操作定义为:
若将并集[[q]]的嵌入表示为[[qi]]嵌入的集合
6.根据权利要求2所述的面向知识图谱多跳推理的锥嵌入方法,其特征在于,对生成的所述锥嵌入的非操作定义为:
给定实体集合[[q]],非操作的生成定义的嵌入为:
[θ′ap]i=2π-[θap]i。
7.根据权利要求2所述的面向知识图谱多跳推理的锥嵌入方法,其特征在于,所述训练好的查询锥嵌入模型按以下方式计算该锥嵌入与给定实体嵌入之间的距离:
其中,dcon的定义为:do和di分别是外部距离和内部距离;是查询q的锥嵌入;λ是一个取值小于1的固定参数,取值为,所述do和di定义分别为:
ddis的定义为:
所述查询锥嵌入模型训练的损失函数为:
其中,γ>0是固定参数,v是正样本实体,v′i是负样本实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110692090.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:放射科挡铅架
- 下一篇:一种内冷钻头制备方法、内冷钻头和加热装置