[发明专利]基于义原-义项信息提升知识图谱关系预测性能的方法有效

专利信息
申请号: 201911388539.8 申请日: 2019-12-27
公开(公告)号: CN111125318B 公开(公告)日: 2021-04-30
发明(设计)人: 赵国帅;李童;黄剑;于海阳;杨震 申请(专利权)人: 北京工业大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/36;G06F16/951;G06F40/295;G06F40/30
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 吴荫芳
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 义项 信息 提升 知识 图谱 关系 预测 性能 方法
【权利要求书】:

1.基于义原-义项信息提升知识图谱关系预测性能的方法,其特征在于:该方法的时间步骤如下,

步骤(1)获取知识图谱数据集

所述知识图谱用于描述真实世界中实体及其相互关系,组织成图;知识图谱中存有大量的知识,知识形式为三元组(头实体,关系,尾实体);

步骤(2)获取知识图谱数据集中三元组所对应的文本描述

步骤(3)获取义原-义项知识库

首先对步骤(1)中获取的知识图谱数据集中所有关系中的单词进行校对,

然后依托校对后的所有单词和步骤(2)获取的全部三元组描述,利用开源的OpenHowNet网站的API——OpenHowNet,获取校对后的所有单词的义原-义项知识库;

步骤(4)将知识图谱中的关系和三元组描述表示为基于义原的one-hot向量

校对后的关系和三元组描述形式相同,表示为V,V由n个单词wi组成,即

V=[w0,w1,...,wn]

将全部单词wi转换成义原的one-hot向量

V的义原的one-hot向量表示为

步骤(5)构建基于义原-义项的PTransE改进模型,并训练得到每一个实体和关系的向量表示;

步骤(6)基于义原-义项的PTransE的知识图谱关系预测

在步骤(5)训练后,得到了训练集S中每一个实体的向量表示和每一个关系的向量表示,关系预测时,对于一对实体,头实体向量表示为h,尾实体向量表示为t;遍历全部关系计算得分,计算时关系的向量表示为r,即三元组(h,r,t),打分函数如下:

根据打分函数分别计算(h,t)与全部关系r的得分,在计算所有得分之后,将所有(h,r,t)的得分从小到大排名,得分越小排名越高,其中不包括知识图谱数据集正确三元组的前3名为可能成立的三元组。

2.根据权利要求1所述的基于义原-义项信息提升知识图谱关系预测性能的方法,其特征在于:步骤2进一步为,

关于世界知识的知识图谱,通过调用WikipediaAPI从Wikipedia获取相应实体的页面,通过实体名的锚文本、关系和关系的同义词,找到相应三元组的对应描述;

关于领域知识图谱的三元组,根据特定任务,在相应的网站中,通过爬虫进行爬取。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911388539.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top