[发明专利]基于义原-义项信息提升知识图谱关系预测性能的方法有效
申请号: | 201911388539.8 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111125318B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 赵国帅;李童;黄剑;于海阳;杨震 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F16/951;G06F40/295;G06F40/30 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 义项 信息 提升 知识 图谱 关系 预测 性能 方法 | ||
1.基于义原-义项信息提升知识图谱关系预测性能的方法,其特征在于:该方法的时间步骤如下,
步骤(1)获取知识图谱数据集
所述知识图谱用于描述真实世界中实体及其相互关系,组织成图;知识图谱中存有大量的知识,知识形式为三元组(头实体,关系,尾实体);
步骤(2)获取知识图谱数据集中三元组所对应的文本描述
步骤(3)获取义原-义项知识库
首先对步骤(1)中获取的知识图谱数据集中所有关系中的单词进行校对,
然后依托校对后的所有单词和步骤(2)获取的全部三元组描述,利用开源的OpenHowNet网站的API——OpenHowNet,获取校对后的所有单词的义原-义项知识库;
步骤(4)将知识图谱中的关系和三元组描述表示为基于义原的one-hot向量
校对后的关系和三元组描述形式相同,表示为V,V由n个单词wi组成,即
V=[w0,w1,...,wn]
将全部单词wi转换成义原的one-hot向量
V的义原的one-hot向量表示为
步骤(5)构建基于义原-义项的PTransE改进模型,并训练得到每一个实体和关系的向量表示;
步骤(6)基于义原-义项的PTransE的知识图谱关系预测
在步骤(5)训练后,得到了训练集S中每一个实体的向量表示和每一个关系的向量表示,关系预测时,对于一对实体,头实体向量表示为h,尾实体向量表示为t;遍历全部关系计算得分,计算时关系的向量表示为r,即三元组(h,r,t),打分函数如下:
根据打分函数分别计算(h,t)与全部关系r的得分,在计算所有得分之后,将所有(h,r,t)的得分从小到大排名,得分越小排名越高,其中不包括知识图谱数据集正确三元组的前3名为可能成立的三元组。
2.根据权利要求1所述的基于义原-义项信息提升知识图谱关系预测性能的方法,其特征在于:步骤2进一步为,
关于世界知识的知识图谱,通过调用WikipediaAPI从Wikipedia获取相应实体的页面,通过实体名的锚文本、关系和关系的同义词,找到相应三元组的对应描述;
关于领域知识图谱的三元组,根据特定任务,在相应的网站中,通过爬虫进行爬取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911388539.8/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置