[发明专利]基于余弦相似度协同过滤的混合推荐方法有效

专利信息
申请号: 201910439840.0 申请日: 2019-05-24
公开(公告)号: CN110175289B 公开(公告)日: 2023-04-07
发明(设计)人: 易运晖;王旭东;陈南;赵楠;何先灯;权东晓;朱畅华 申请(专利权)人: 西安电子科技大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/9536;G06F16/955;G06F16/28;G06F16/335;G06F16/35;G06F16/36
代理公司: 陕西电子工业专利中心 61205 代理人: 王品华
地址: 710071 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 余弦 相似 协同 过滤 混合 推荐 方法
【说明书】:

发明公开了一种基于余弦相似度协同过滤的混合推荐方法,主要解决现有技术获取用户数据单一,数据过于稀疏和推荐性能不高的问题。其步骤为:1.采集用户的信息;2.对用户历史行为数据进行数字化;3.提取出特定群体都感兴趣的文档;4.构建每篇文档与之最相似几篇文档字典;5.构建用户文档评分矩阵;6.用评分矩阵训练出最佳模型;7.根据最佳模型形成推荐列表推荐给用户;8.当用户阅读推荐列表文档到达阈值,重新开始。本发明获取多维度信息,并将其加入到推荐系统中,利用最相似关联公式对数据集进行插入操作,不仅提高了推荐系统的性能,而且缓解了矩阵稀疏性的压力,可用于从大量的数据中找到用户感兴趣的文档。

技术领域

本发明属于机器学习领域。本发明可用于在大量的数据中找到用户感兴趣的新闻或文章,提高推荐系统的性能。

背景技术

推荐系统在现代生活中运用越来越广泛,扮演了越来越重要的角色,例如在电影、书籍、新闻、电商都会有推荐系统的影子。在过去的几十年,大量的信息涌入使得用户面对巨大的数据不知所措,如何准确的推荐有用的信息给用户,满足用户相应的兴趣和需求是非常重要的。手机的快速发展,使得当代网民更倾向于手机阅读新闻文章,所以在大量互联网信息中准确推荐用户喜爱的文章尤为迫切。

常用推荐算法有协同过滤和基于内容的推荐方法。协同过滤主要有矩阵分解MF,奇异值分解SVD等技术,并且需要用户主动的对物品进行打分。协同过滤方法推荐效果虽然很好,但是存在数据稀疏性问题。基于内容的推荐方法,虽然可以很好的推荐用户感兴趣的内容,但是长期来看,推荐的内容单调重复。

王冲等人公开的论文“Collaborative Topic Modeling for RecommendingScientific Articles”(《Proceedings of the 17th ACM SIGKDD internationalconference on Knowledge discovery and data mining》2011年第448-456页)提出了一种算法,以向在线社区的用户推荐科学文章。该方法结合了传统的协同过滤和概率主题建模的优点。它为用户和物品提供可解释的潜在结构,并且可以形成关于现有和新发布文章的推荐列表。该方法取得了不错的效果,其不足的是,没有考虑用户更多的隐性因素如地理位置等,使得推荐性能不高。

尤春继等人公开的论文“Regularized singular value decomposition in newsrecommendation system”(《International Conference on Computer ScienceEducation(ICCSE)》2016年第621-626页)提出了正则化方法,是通过对奇异值分解的学习参数进行正则化。该方法在稀疏性问题上表现出很大的优越性,且在XMU新闻数据集和电影数据集上的实验结果表明了该模型的有效性。但方法由于没有使用用户的信息和物品的信息,并且数据单一,因而不能够很好的适用某些特定的场景。

发明内容

本发明的目的在于针对上述现有技术存在的不足,提出一种基于余弦相似度协同过滤的混合推荐方法,以获取更多用户数据,提高推荐系统的性能。

本发明的基本思路是,先采取多种方法从不同维度进行数据采集;对于收集到的数据进一步处理;然后采用数据挖掘相关方法构建相似文档列表,进而构建用户物品评分矩阵,并且根据文档的重要程度插入一定数量最相似的文档;然后利用奇异值分解SVD处理矩阵;最后形成推荐列表进行推荐。

根据上述思路,本发明的实现方案包括如下步骤:

(1)数据收集

1a)采集用户行为数据,包括:点击、点赞和转发;

1b)以软件,编程方法,采集用户的附加信息,包括:用户的位置、局域网、统一资源定位符URL和IP地址这些信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910439840.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top