[发明专利]一种基于知识图谱表示学习的推荐系统在审

专利信息
申请号: 202110491668.0 申请日: 2021-05-06
公开(公告)号: CN113486234A 公开(公告)日: 2021-10-08
发明(设计)人: 陈境;高阳 申请(专利权)人: 南京大学;江苏万维艾斯网络智能产业创新中心有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/28
代理公司: 南京泰普专利代理事务所(普通合伙) 32360 代理人: 方晓雯
地址: 210023 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 图谱 表示 学习 推荐 系统
【权利要求书】:

1.一种基于知识图谱表示学习的推荐系统,其特征在于,包括如下步骤:

步骤1、对异源,包括关系型数据库、非关系型数据库和HDFS分布式文件存储系统及异构,包括非结构化数据、半结构化数据和结构化数据,按照规范格式进行数据格式化处理;

步骤2、对格式化后的数据进行数据预处理,抽取生成知识图谱表示学习算法模型和基于知识图谱表示学习的推算法模型所需的训练和测试数据集;

步骤3、构建知识图谱表示学习算法模型和基于知识图谱表示学习的推荐算法模型;

步骤4、算法模型训练结果曲线图以及数值化展示。

2.根据权利要求1所述的一种基于知识图谱表示学习的推荐系统,所述步骤1中的数据格式化处理,具体处理过程:

对于存储在关系型数据库MySQL、非关系型数据库Hive和分布式文件存储系统HDFS中的非结构化数据、半结构化数据,按照数据格式规范进行属性等抽取,得到结构化数据;

针对结构化类型数据,如RDF、TTL、RDFS、OWL和JSON等,从结构中抽取知识图谱三元组,包含实体和关系,构建知识图谱表示学习数据文件和推荐系统用户及领域图谱数据。

3.根据权利要求1所述的一种基于知识图谱表示学习的推荐系统,所述步骤2中的数据预处理,具体处理过程:

将数据格式化后生成的数据首先按照比例抽取划分生成训练集、测试集和验证集,针对知识图谱数据集需要构建对应的实体ID映射文件和关系ID映射文件,通过全局ID得到实体数据和关系数据;针对推荐算法,数据预处理生成用户图谱三元组数据文件和历史记录三元组数据文件。

4.根据权利要求1所述的一种基于知识图谱表示学习的推荐系统,所述步骤3中的构建知识图谱表示学习算法模型包含TransE、TransH、TransR、TransD和优化后的算法模型TransMix;构建的基于知识图谱表示学习的推荐算法模型,包含DKN、MKR、RippleNet,整个构建过程包含参数构建和模型构建两个部分。

5.根据权利要求4所述的一种优化后的知识图谱表示学习算法模型TransMix,其特征在于,所述的优化后的知识图谱表示学习算法为:

步骤1、输入训练集S={(h,l,t)},实体集E,关系集L,间隔参数γ,向量的维度k和权重矩阵集Mr

步骤2、初始化三元组实体、关系和权重矩阵;

步骤3、对训练集按照批处理大小进行采样;

步骤4、根据采样的数据构造正负样本对;

步骤5、根据批数据对应复杂关系选择对应算法模型;

步骤6、根据损失函数进行梯度更新,更新实体向量、关系向量和权重矩阵,损失函数如下:

6.根据权利要求5所述的优化后的知识图谱表示学习优化算法,所述步骤4,其特征在于,构造正负样本对过程如下:

步骤1、对于每个关系,计算每个头实体对应的尾实体数量,记为tph;

步骤2、对于每个关系,计算每个尾实体对应的头实体数量,记为hpt;

步骤3、计算概率值表示替换头实体的概率;

步骤4、遍历采样数据,对于每个三元组(h,r,t),基于关系r计算所得的替换头实体概率选择替换头实体或者尾实体得到负样本,与正样本拼接得到一对正负样本对。

7.根据权利要求4所述的知识图谱表示学习算法模型的构建,其特征在于,所述的知识图谱表示学习算法模型的构建具体过程为:

模型参数构建:指定训练集文件train、测试集文件test、验证集文件、实体映射文件、关系映射文件、正负样本间隔参数、向量化维度参数、模型学习率、正负样本距离计算范数、训练轮次、损失结果输出路径、实体向量化后的输出文件路径和关系向量化后的输出文件路径;

模型构建:根据选择不同的算法模型(TransE、TransH、TransR、TransD和TramsMix)需要配置不同的参数选择;完成模型参数构建后,开始算法模型的训练任务。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;江苏万维艾斯网络智能产业创新中心有限公司,未经南京大学;江苏万维艾斯网络智能产业创新中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110491668.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top