[发明专利]一种基于用户群关联度的个性化推荐方法及系统有效
申请号: | 201210590104.3 | 申请日: | 2012-12-29 |
公开(公告)号: | CN103077220A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | 高明;黄哲学 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 宋鹰武 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 关联 个性化 推荐 方法 系统 | ||
技术领域
本发明属于互联网通信领域,尤其涉及一种基于用户群关联度的个性化推荐方法和系统。
背景技术
推荐系统是根据用户的历史行为记录,如商品购买记录、网络点击日志等信息,分析用户兴趣爱好,并根据分析结果向其推荐相应产品或信息的智能系统。
协同过滤是当前推荐系统中最常用、最有效的算法,算法的出发点是具有相同或者相似兴趣偏好的用户,对产品的评价也是类似的。其主要步骤有两个:1、查找n个与目标用户最相似的其他用户,称为最近邻居;2、根据最近邻居对产品的评分情况来预测目标用户对产品可能的评分值,并向目标用户推荐预测评分值最高的前m个产品。
随着用户数量和系统规模的不断扩大,协同过滤技术面临严重的数据稀疏性、推荐的实时性以及推荐系统的可扩展性等方面的挑战。
请参阅图1及图2,本发明人发现其主要问题之一在于:如图1所示,在海量数据环境下,需要计算目标用户与其他所有用户之间的相似度,导致了算法效率低下。如图2所示,针对此问题,基于聚类的协同过滤算法通常的做法是:通过事先对用户离线进行聚类作为解决方案。当需要在线推荐时,系统从用户所在聚簇(用户群)中选择最近邻居,通过这样的方法可以降低目标用户对最近邻居的搜索空间,达到提高算法效率的目标,其基本步骤如下:
(1)、离线对用户进行聚类;
(2)、在目标用户所在聚簇查找n个最近邻居。
(3)、根据n个最近邻居对产品的评分预测用户对相关产品的评分值。
(4)、根据预测评分值的高低,选取前m个产品推荐给用户。
然而,如图3所示,本发明的发明人进一步发现,基于聚类的协同过滤算法存在着如下问题:当用户在聚簇中所处位置与聚簇中心的距离大于所在位置与聚簇边缘的位置时,目标用户与其他聚簇内用户的距离往往小于其所在聚簇用户的距离。以聚类阶段使用k-means算法为例,对用户聚类的标准应该是用户被划分到与其最接近的类别中心所标识的聚簇。然而,由于“目标用户”到聚簇A中心点的距离小于其到聚簇B中心点的距离,因此导致“目标用户”虽然被划分到聚簇A中,但是“目标用户”到“用户D”的距离却小于其到“用户E”的距离。
如图3所示,由于“目标用户”和“用户D”分别处于不同的聚簇A与聚簇B,因此使用当前的基于聚簇的协同聚类算法,在选择“目标用户”的最近邻居时,舍弃了“用户D”而选择用户“E”,导致遗漏了大量类似“用户E”的最近邻居,使得推荐结果的误差较高。
发明内容
有鉴于此,本发明实施例提供一种基于用户群关联度的个性化推荐方法和系统,旨在解决上述因目标用户与真实最近邻居大量丢失而造成推荐结果误差较大的问题。
为此,本发明实施例提供了如下技术方案:
一种基于用户群关联度的个性化推荐方法,包括:
A、使用聚类算法对用户进行聚类;
B、判断目标用户与聚簇边缘的距离,当距离大于给定阈值则执行步骤C,否则:
B-1、计算目标用户所在聚簇与其他聚簇之间的关联度;
B-2、合并与用户所在聚簇最相关的前r个聚簇;
B-3、在合并后的聚簇内查找n个最近邻居,进而执行步骤D;
C、在目标用户所在聚簇中查找n个最近邻居;
D、根据最近邻居对产品的评分预测用户对相关产品的评分值;以及
E、根据预测评分值的高低,选取前m个产品推荐给用户。
另外,本发明实施例还进一步提供了如下技术方案:
一种基于用户群关联度的个性化推荐系统,包括:
聚类模块,用于使用聚类算法对用户进行聚类;
判断模块,用于判断目标用户与聚簇边缘的距离,当距离大于给定阈值则执行查找模块,否则执行关联度计算单元、聚簇合并单元、以及查找子单元,其中关联度计算单元用于计算目标用户所在聚簇与其他聚簇之间的关联度;聚簇合并单元用于合并与用户所在聚簇最相关的前r个聚簇;查找子单元用于在合并后的聚簇内查找n个最近邻居并提交给评分预测模块;
查找模块,用于在目标用户所在聚簇中查找n个最近邻居;
评分预测模块,用于根据最近邻居对产品的评分预测用户对相关产品的评分值;以及
推荐模块,用于根据预测评分值的高低,选取前m个产品推荐给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210590104.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电动式购物车
- 下一篇:统一资源定位符匹配处理方法及装置