[发明专利]一种基于混合翻译模型的带时间知识图谱嵌入方法在审

专利信息
申请号: 201911335182.7 申请日: 2019-12-23
公开(公告)号: CN111209408A 公开(公告)日: 2020-05-29
发明(设计)人: 王治豪;李鑫 申请(专利权)人: 华东师范大学
主分类号: G06F16/36 分类号: G06F16/36;G06F40/44;G06F40/58
代理公司: 上海蓝迪专利商标事务所(普通合伙) 31215 代理人: 徐筱梅;张翔
地址: 200241 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 混合 翻译 模型 时间 知识 图谱 嵌入 方法
【权利要求书】:

1.一种基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,包括以下步骤:

步骤1:输入需要补全的时序知识图谱数据集,根据数据集大小进行初始化设置;

步骤2:使用混合翻译模型对知识图谱的嵌入表示进行更新,得到嵌入表示结果;

步骤3:根据嵌入表示结果对使用的知识图谱数据集进行补全操作。

2.根据权利要求1所述的基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,步骤1中,所述初始化设置具体步骤为:

步骤A1:随机初始化数据集中实体与关系,以向量的形式进行展现,得到初始的关系向量与实体向量;

步骤A2:对于每个关系向量,加入到关系集合R当中,对于每个实体向量,加入到实体集合E当中。

3.根据权利要求1所述的基于混合翻译模型的带时间知识图谱潜入方法,其特征在于,步骤2中,所述使用混合翻译模型对知识图谱的嵌入表示进行更新,具体步骤为:

步骤B1:从数据集的训练集中采样固定大小为batch的一批数据;

步骤B2:构建负样本数据集,对batch中的三元组,随机替换h、r或t生成一个错误的三元组加入到这一批数据当中,构成当前批次所用的训练数据;

步骤B3:将正确三元组(h,r,t)与错误三元组[(h,r`,t)、(h`,r,t)或(h,r,t`)]从实体空间映射到关系空间,得到关系空间中的正确三元组(h,r,t)与错误三元组[(h,r`,t)、(h`,r,t)或(h,r,t`)];

步骤B4:将关系空间中的所有三元组投影到相应时间τ所构建的超平面上;

步骤B5:计算损失函数,采用梯度下降的算法更新实体与关系的嵌入表示;

步骤B6:重复步骤B1-B5,直至得到的结果稳定。

4.根据权利要求3所述的基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,步骤B2中,所述构建负样本数据集的方式为:

h、r、t、h`、r`、t`表示实体和关系的嵌入表示,其中h`表示随机替换的头部实体,r`表示随机替换的关系,t`表示随机替换的尾部实体,D+表示正样本集合,Dx,τ-表示负样本数据集。

5.根据权利要求3所述的基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,步骤B3中,所述从实体空间映射到关系空间的方式为:

其中Mrh、Mrt为映射矩阵,rp表示关系的投影向量,Im×n表示m×n大小的单位矩阵,hpT表示头部实体的投影转置向量,h表示映射后处于关系空间中的头部实体的嵌入表示,tpT表示尾部实体的投影转置向量,t表示映射后处于关系空间中的尾部实体的嵌入表示。

6.根据权利要求3所述的基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,步骤B4中,将关系空间中的所有三元组投影到相应时间τ所构建的超平面上的方式为:

其中,ωτ表示所构建的对应时间τ的超平面。

7.根据权利要求3所述的基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,步骤B5中,所述的损失函数为:

其中,fτ(x)、fτ(y)评分函数,x、y表示正样本与负样本,f=||hτ+rτ-tτ||L1/L2,L1、L2为正则化项,γ为正负样本之间的最小间隔,T表示所有时间的集合。

8.根据权利要求1所述的基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,所述步骤3具体为:

步骤C1:对于一个三元组(h,r,t),首先检查h、t是否属于E,r是否属于R,不属于的话,那么h、t或r就不作为头尾实体或关系,这个三元组不成立,如果属于的话,则执行下一步;

步骤C2:根据成立的三元组,计算其评分函数f=||hτ+rτ-tτ||L1/L2,对所有成立的三元组进行排序,排序靠前的结果即为最优结果,用于补全。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911335182.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top