[发明专利]一种分布式知识图谱嵌入方法有效

申请号：	201810429012.4	申请日：	2018-05-08
公开（公告）号：	CN108427773B	公开（公告）日：	2022-06-21
发明（设计）人：	李武军;牛晓帆	申请（专利权）人：	南京大学
主分类号：	G06F16/36	分类号：	G06F16/36;G06F9/50
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	李玉平
地址：	210008 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种分布式知识图谱嵌入方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种分布式知识图谱嵌入方法，其特征在于，包括Worker执行的步骤和Server执行的步骤：

所述方法中Worker执行的具体步骤为：

步骤100，初始化算法参数，包括嵌入向量的维度d，总共执行的轮数T，每轮采样的三元组数B，学习率μ，正则项参数λ，间隔γ，Worker数量N_w，Server的数量N_s；

步骤101，读取知识图谱的统计信息，包括实体的数量n_e，关系的数量n_r；

步骤102，读取当前Worker所负责训练的三元组数据，整个知识图谱中的三元组集合被等量划分为N_w份，每个Worker读取一份；

步骤103，令计数器i＝0；

步骤104，从当前Worker负责的三元组中采样B/N_w个，作为轮训练的正例三元组集合；

步骤105，对于采样出的每一个正例三元组随机替换其头部或尾部，作为负例三元组，与原正例三元组组成一个三元组对；

步骤106，发送各个三元组对到各个Server；

步骤107，从各个Server处接受各个三元组对的损失；

步骤108，统计各个三元组对的总损失，对于总损失大于间隔γ的三元组对设置更新标志为1，对于总损失小于间隔γ的三元组对设置更新标志为0；

步骤109，将更新标志发送给各个Server；

步骤110，令计数器i＝i+1；

步骤111，判断计数器i的值是否小于执行轮数T；如果是，回到步骤104，进行新的一轮计算；如果不是，已满足停止条件，进入结束阶段；

步骤112，结束计算。

2.如权利要求1所述的分布式知识图谱嵌入方法，其特征在于，所述方法中Server执行的具体步骤为：

步骤200，初始化算法参数，包括嵌入向量的维度d，总共执行的轮数T，每轮采样的三元组数B，学习率μ，正则项参数λ，间隔γ，Worker数量N_w，Server的数量N_s；

步骤201，读取知识图谱的统计信息，包括实体的数量n_e，关系的数量n_r；

步骤202，初始化嵌入向量；维度d被划分为等量的N_s份，每个Server负责初始化一份，即所有实体和关系对应的嵌入向量中相同的一部分维度；

步骤203，令计数器i＝0；

步骤204，接收Worker发来的三元组对；

步骤205，对于Worker发来的三元组对，根据优化的目标方程，计算该Server负责的维度上产生的损失；

步骤206，发送三元组对的损失到对应的Worker上；

步骤207，接收Worker发来的各三元组对的更新标志；

步骤208，对于各个三元组对，若其对应更新标志为1，对该三元组对的嵌入向量进行更新；若为0，不进行更新；

步骤209，令计数器i＝i+1；

步骤210，判断计数器i的值是否小于执行轮数T；如果是，回到步骤204，进行新的一轮计算；如果不是，已满足停止条件，进入结束阶段；

步骤211，算法结束，将得到的嵌入向量进行保存。

3.如权利要求2所述的分布式知识图谱嵌入方法，其特征在于，所述步骤205中，优化的目标方程为：

其中，P为知识图谱中的三元组集合，其中每一个三元组由头部h，关系r，尾部t组成，表示为(h,r,t)；头部和尾部都属于实体集合E，关系属于关系集合R；N(h,r,t)为三元组(h,r,t)随机替换头部和尾部得到的负例三元组集合；θ代表所有的参数，包括每一个实体e∈E对应的嵌入向量和每一个关系r∈R对应的嵌入向量s(h,r,t)为(h,r,t)三元组的得分，[x]₊在x0情况下等于x，否则等于0。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京大学，未经南京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810429012.4/1.html，转载请声明来源钻瓜专利网。

上一篇：在线报表生成方法、系统、设备及存储介质
下一篇：一种用于内容推荐的方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种分布式知识图谱嵌入方法有效

专利文献下载