[发明专利]一种基于知识图谱表示学习和神经网络的协同推荐方法有效
申请号: | 202010378310.2 | 申请日: | 2020-05-07 |
公开(公告)号: | CN111582509B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 王攀;黄琛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06N20/20 | 分类号: | G06N20/20;G06N3/08;G06F16/36 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 彭雄 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 表示 学习 神经网络 协同 推荐 方法 | ||
本发明公开了一种基于知识图谱表示学习和神经网络的协同推荐方法,将数据集中的项目映射到公开知识图谱三元组,作为训练集输入到OpenKE框架中进行模型训练,其中同过设置参数的方式来选择采用知识图谱表示学习方法进行学习,按照顺序将实体集的对应向量矩阵E′反映射回项目个体,得到每一个项目构建好其对应的低维度稠密特征向量Ikem,将正例低维度稠密特征向量Ikem‑pos和负例低维度稠密特征向量Ikem‑neg读入模型中,并替换掉传统向量层操作,即为知识嵌入向量层最终输出,然后神经网络训练层开始训练,本发明能够解决评分矩阵稀疏和冷启动的问题,并增强了协同过滤推荐的性能和准确性。
技术领域
本发明提出一种基于知识图谱表示学习和神经网络的协同推荐方法,属于深度学习和推荐系统的技术领域。
背景技术
在传统的推荐系统中,因其依赖于矩阵分解协同过滤算法进行推荐,不可避免地会出现冷启动和数据稀疏性问题。数据稀疏性问题往往是指在比如大规模电商等平台,用户和项目数量非常大,但是在获得的用户-项目矩阵中,用户平均有交互的项目数量较小,这样就会造成用户-项目矩阵稀疏。而冷启动问题是指如何在没有大量用户数据的情况下为新用户做个性化推荐。数据的稀疏性问题最终会导致无法捕捉到不同用户和不同项目之间的关系,从而降低了推荐系统的准确度。神经网络可以从更高的维度去剖析事物和事物之间的关系,也让数据稀疏性问题得到了改善。冷启动问题归根结底还是数据的信息维度不够。知识图谱中包含了一个事物在现实世界中的事实关系,相当于对于模型中需要训练的数据提供了额外的信息维度,从而一定程度上的解决了冷启动问题。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种基于知识图谱表示学习和神经网络的协同推荐方法,本发明能够解决评分矩阵稀疏和冷启动的问题,并增强了协同过滤推荐的性能和准确性。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于知识图谱表示学习和神经网络的协同推荐方法,包括以下步骤:
步骤1,获取数据集,将数据集中的项目映射到公开知识图谱三元组K,并为项目分别构建其对应的实体集E、关系集R、以及训练集S;
步骤2,构建好的实体集E、关系集R、以及训练集S作为训练集输入到OpenKE框架中进行模型训练,其中同过设置参数的方式来选择采用知识图谱表示学习方法进行学习;
步骤3,第二步训练过程中会输出实体集的对应向量矩阵E′,根据第二步输入的实体集E 的项目顺序,按照顺序将实体集的对应向量矩阵E′反映射回项目个体,最终为每一个项目构建好其对应的低维度稠密特征向量Ikem;
步骤4,将步骤3得到的低维度稠密特征向量Ikem做正例、负例选择处理,生成正例低维度稠密特征向量Ikem-pos和负例低维度稠密特征向量Ikem-neg,之后加入一个读入模块,将正例低维度稠密特征向量Ikem-pos和负例低维度稠密特征向量Ikem-neg读入模型中,并替换掉传统向量层操作,即为知识嵌入向量层最终输出,然后神经网络训练层开始训练。
优选的:步骤3中的反映射指将训练结束之后输出的每一个低维度稠密特征向量Ikem按顺序对应到每一个输入的实体集E的项目编号。
优选的:知识表示学习方法包括TransE方法、TransR方法、TransH方法、TransD方法。
优选的:知识嵌入向量层是一个离线处理数据的组件。
本发明相比现有技术,具有以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010378310.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:页面回收方法及装置
- 下一篇:一种智能交互方法及智能交互式课桌