[发明专利]一种基于内容和评分的组合预测方法有效
| 申请号: | 201510408040.4 | 申请日: | 2015-07-13 |
| 公开(公告)号: | CN105183748B | 公开(公告)日: | 2018-11-06 |
| 发明(设计)人: | 程红蓉;张锋;唐明霜;郭彦伟;蔡腾远 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 内容 评分 组合 预测 方法 | ||
本发明公开了一种基于内容和评分的组合预测方法,属于推荐系统领域。本发明包括:根据用户信息以及物品信息生成用户和物品特征,根据现有用户对物品的评分生成内容特征,使用评分作为类标,将类标与生成的内容特征结合,作为分类器的输入进行训练得到基于内容的评分预测模型,通过对现有的用户‑物品评分矩阵进行填充形成更为稠密的用户‑物品评分矩阵,通过对稠密的用户‑物品评分矩阵进行学习从而形成最终的预测结果。本发明通过利用用户的个人信息以及物品的信息来提高最终评分预测的精确度。
技术领域
本发明属于推荐系统技术领域,具体涉及推荐系统中一种基于内容以及评分的组合预测方法。
背景技术
随着互联网的飞速发展,产生了各种各样的Web应用,信息的爆发式增长使得人们在大量信息面前变得无所适从,为了解决这种由信息爆发式增长而造成的问题,搜索引擎技术得以快速发展,然而搜索引擎只是一种主动查找信息的工具,在用户不知道自身需求的情况下,是无法借助于搜索引擎找到用户所感兴趣的信息。为了解决这个问题,对于推荐系统的研究逐渐得到了重视。随着推荐系统的研究的深入,各种各样的推荐系统正在各种商业性网站中得到运用。
推荐系统是一种分析用户的历史行为并且根据用户的历史行为推荐用户所感兴趣信息的一种技术。目前现有的推荐系统的算法通常使用基于邻居的推荐算法,典型的算法包括基于用户的协同过滤以及基于物品的系统过滤。除了基于邻居的推荐算法之外还有使用奇异值分解进行推荐的算法,该算法属于基于模型的推荐算法。此外深度学习也逐渐在推荐系统中崭露头角,目前有基于限制性玻尔兹曼机的协同过滤算法,该算法取得了较为不错的预测精度。
然而上述算法的性能却不是那么地令人满意,其中基于邻居的算法其局限性在于当用户数和物品数增大之后,在进行用户或者物品之间的相似度计算所需要的时间将增大。奇异值分解算法虽然不会随着用户和物品的数量的增大而导致计算量迅速增大,但是其在冷启动的时候其性能却受到非常大的影响。此外奇异值分解算法以及限制性玻尔兹曼机协同过滤算法都只局限在了分析用户所产生的评分数据上,并不能利用用户以及物品的其他信息,比如用户的个人信息,物品的描述信息等。此外仅仅利用用户所产生的评分进行预测的精度也较为有限。
本发明采用内容特征生成预测评分,通过筛选基于内容特征生成的预测评分,并对预测评分进行阈值筛选,将经过筛选的预测评分填充用户-物品评分矩阵中的部分缺失值,使用限制性玻尔兹曼机对填充过的矩阵进行学习,最终使用该模型对缺失评分进行预测。该方法充分利用用户以及物品的信息,能够克服推荐系统冷启动问题,并且该方法还考虑到了评分矩阵的稀疏性对于最终预测的影响,将内容特征融合到现有推荐方法中,进一步提高了推荐算法的性能。
发明内容
本发明的发明目的在于:传统的推荐系统算法的缺点主要是仅仅使用了用户对于物品的评分数据,并没有使用用户以及物品的信息,这从信息的利用率上是不够的,此外传统的推荐系统算法不能够处理用户数以及物品数较大的情况,在面对推荐系统冷启动问题时性能急剧下降。本发明通过引入用户特征以及物品特征所形成的内容特征,将现有的评分作为类标,训练基于内容的分类器,使用该分类器根据缺失评分所生成的内容特征得出缺失评分的预测值,采用阈值筛选出较为合适的预测值以及现有的评分值作为基于限制性玻尔兹曼机协同过滤算法的输入进行训练,得出更为优秀的模型,然后使用该模型进行预测,从而改善预测精度。
本发明的技术方案分为如下几个基本的步骤:
步骤a.将评分数据集进行划分通过将评分数据集进行划分,划分为训练集a、训练集b以及测试集。其中训练集a作为学习最优参数所需要的集合,训练集b作为学习最优限制性玻尔兹曼机协同过滤模型所需要的模型,测试集为了测试系统性能。
步骤b.获取最优筛选阈值
通过训练集a、用户数据、物品数据获得最优的筛选阈值。
步骤c.获取最优限制性玻尔兹曼机协同过滤模型
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510408040.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:户用空调热泵装置
- 下一篇:一种漆包线的包装运输结构
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





