[发明专利]一种基于张量分解的知识推理方法、装置、设备在审
申请号: | 202110024807.9 | 申请日: | 2021-01-08 |
公开(公告)号: | CN113051404A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 陶建华;邵朋朋;刘通;杨国花;张大伟 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/2455 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 张量 分解 知识 推理 方法 装置 设备 | ||
1.一种基于张量分解的知识推理方法,其特征在于,所述方法包括:
对时序知识图谱数据集中的数据进行提取,得到多组四元组数据,所述多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间;
对所述多组四元组数据进行标注及处理,将处理好的四元组数据作为训练材料;
将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中,利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练,得到训练好的时序知识推理模型及其变体模型;
使用所述训练好的时序知识推理模型及其变体模型分别执行预测任务,推理问题的答案,得到最终的推理结果。
2.根据权利要求1所述的方法,其特征在于,对时序知识图谱数据集中的数据进行提取,得到多个四元组数据,包括:
对所述时序知识图谱数据集中的实体集、关系集以及时间集进行提取;
由所述实体集、关系集以及时间集组成所述多组四元组数据,所述多组四元组数据中的每组四元组数据为:头实体,关系,尾实体,时间;
为所述多组四元组数据中的每组四元组数据增加其逆关系的四元组数据,其中,所述逆关系的四元组数据为:尾实体,关系-1,头实体,时间。
3.根据权利要求1所述的方法,其特征在于,对所述多组四元组数据进行标注及处理,将处理好的四元组数据作为训练材料,包括:
将所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的任一元素进行标注,作为标签元素;
将所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的头实体、时序关系、尾实体和时序信息进行初始化表示;
计算所述多组四元组数据中的每组四元组数据及其逆关系的四元组数据中的核心张量以及非时序关系,将所述核心张量以及非时序关系进行初始化表示,得到处理好的四元组数据。
4.根据权利要求1所述的方法,其特征在于,将所述训练材料输入基于张量分解的时序知识推理模型及其变体模型中,利用梯度下降算法对所述时序知识推理模型及其变体模型分别进行训练,得到训练好的时序知识推理模型及其变体模型,所述基于张量分解的时序知识推理模型及其变体模型的构建及训练过程包括:
对Tucker分解进行扩展,得到对时序四元组的Tucker分解,进而得到所述时序知识推理模型及其变体模型的初始形式;
将所述时序知识推理模型及其变体模型中的时序信息与关系进行关联表达出三元组的时序性,得到所述时序知识推理模型及其变体模型的最终形式;
根据目标函数对所述时序知识推理模型及其变体模型分别进行训练,得到所述训练好的时序知识推理模型及其变体模型。
5.根据权利要求4所述的方法,其特征在于,对Tucker分解进行扩展,得到对时序四元组的Tucker分解,进而得到所述时序知识推理模型及其变体模型的初始形式,是按照以下公式实现的:
TuckERT:
TuckERTNT:
其中,TuckERT表示时序知识推理模型,TuckERTNT表示时序知识推理模型的变体模型,E表示实体,R表示关系,T表示时间信息,NT是non-temporal(非时序信息)的缩写,表示张量值,es,er,eo,et分别为头实体,关系,尾实体和时间信息的浅层表示,1表示非时序信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110024807.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:密闭式无针连接外接头及其应用的留置针
- 下一篇:一种拨轮组件及智能锁