[发明专利]基于余弦相似度协同过滤的混合推荐方法有效
| 申请号: | 201910439840.0 | 申请日: | 2019-05-24 |
| 公开(公告)号: | CN110175289B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 易运晖;王旭东;陈南;赵楠;何先灯;权东晓;朱畅华 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/955;G06F16/28;G06F16/335;G06F16/35;G06F16/36 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
| 地址: | 710071 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 余弦 相似 协同 过滤 混合 推荐 方法 | ||
本发明公开了一种基于余弦相似度协同过滤的混合推荐方法,主要解决现有技术获取用户数据单一,数据过于稀疏和推荐性能不高的问题。其步骤为:1.采集用户的信息;2.对用户历史行为数据进行数字化;3.提取出特定群体都感兴趣的文档;4.构建每篇文档与之最相似几篇文档字典;5.构建用户文档评分矩阵;6.用评分矩阵训练出最佳模型;7.根据最佳模型形成推荐列表推荐给用户;8.当用户阅读推荐列表文档到达阈值,重新开始。本发明获取多维度信息,并将其加入到推荐系统中,利用最相似关联公式对数据集进行插入操作,不仅提高了推荐系统的性能,而且缓解了矩阵稀疏性的压力,可用于从大量的数据中找到用户感兴趣的文档。
技术领域
本发明属于机器学习领域。本发明可用于在大量的数据中找到用户感兴趣的新闻或文章,提高推荐系统的性能。
背景技术
推荐系统在现代生活中运用越来越广泛,扮演了越来越重要的角色,例如在电影、书籍、新闻、电商都会有推荐系统的影子。在过去的几十年,大量的信息涌入使得用户面对巨大的数据不知所措,如何准确的推荐有用的信息给用户,满足用户相应的兴趣和需求是非常重要的。手机的快速发展,使得当代网民更倾向于手机阅读新闻文章,所以在大量互联网信息中准确推荐用户喜爱的文章尤为迫切。
常用推荐算法有协同过滤和基于内容的推荐方法。协同过滤主要有矩阵分解MF,奇异值分解SVD等技术,并且需要用户主动的对物品进行打分。协同过滤方法推荐效果虽然很好,但是存在数据稀疏性问题。基于内容的推荐方法,虽然可以很好的推荐用户感兴趣的内容,但是长期来看,推荐的内容单调重复。
王冲等人公开的论文“Collaborative Topic Modeling for RecommendingScientific Articles”(《Proceedings of the 17th ACM SIGKDD internationalconference on Knowledge discovery and data mining》2011年第448-456页)提出了一种算法,以向在线社区的用户推荐科学文章。该方法结合了传统的协同过滤和概率主题建模的优点。它为用户和物品提供可解释的潜在结构,并且可以形成关于现有和新发布文章的推荐列表。该方法取得了不错的效果,其不足的是,没有考虑用户更多的隐性因素如地理位置等,使得推荐性能不高。
尤春继等人公开的论文“Regularized singular value decomposition in newsrecommendation system”(《International Conference on Computer ScienceEducation(ICCSE)》2016年第621-626页)提出了正则化方法,是通过对奇异值分解的学习参数进行正则化。该方法在稀疏性问题上表现出很大的优越性,且在XMU新闻数据集和电影数据集上的实验结果表明了该模型的有效性。但方法由于没有使用用户的信息和物品的信息,并且数据单一,因而不能够很好的适用某些特定的场景。
发明内容
本发明的目的在于针对上述现有技术存在的不足,提出一种基于余弦相似度协同过滤的混合推荐方法,以获取更多用户数据,提高推荐系统的性能。
本发明的基本思路是,先采取多种方法从不同维度进行数据采集;对于收集到的数据进一步处理;然后采用数据挖掘相关方法构建相似文档列表,进而构建用户物品评分矩阵,并且根据文档的重要程度插入一定数量最相似的文档;然后利用奇异值分解SVD处理矩阵;最后形成推荐列表进行推荐。
根据上述思路,本发明的实现方案包括如下步骤:
(1)数据收集
1a)采集用户行为数据,包括:点击、点赞和转发;
1b)以软件,编程方法,采集用户的附加信息,包括:用户的位置、局域网、统一资源定位符URL和IP地址这些信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910439840.0/2.html,转载请声明来源钻瓜专利网。





