[发明专利]一种基于用户轨迹的协同过滤推荐方法、装置及系统有效
申请号: | 201310030471.2 | 申请日: | 2013-01-25 |
公开(公告)号: | CN103116614A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 晋向前;傅一峰;王敏;张磊;杨子斌 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀区海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 轨迹 协同 过滤 推荐 方法 装置 系统 | ||
技术领域
本发明涉及网络技术领域,具体涉及一种基于用户轨迹的协同过滤推荐方法、装置及系统。
背景技术
随着互联网技术的不断发展,用户能够获得的信息量不断增加,用户面临着信息过载的问题。例如,当用户以休闲为目的没有明确需求时浏览视频网站或视频客户端时,面对数不胜数的视频文件,用户会面对不知如何进行选择的问题。因此,需要推荐系统帮助用户进行信息过滤。协同过滤推荐是信息过滤和信息系统中的一项重要技术。
在现有技术中,协同过滤推荐算法的步骤包括:记录并统计用户的浏览记录;利用存在相似兴趣的用户群体或与用户兴趣相似的信息做推荐;当用户产生新的浏览行为时,推荐系统对用户没有看过但可能感兴趣的信息队列重新排序,推荐给用户。
但是,协同过滤推荐算法在线运算中往往需要考虑到实际服务器的压力来简化算法。在拥有千万级用户的网站中,如果要维护一个用户相似度矩阵,从存储和计算的角度来说,维护成本很高。因此在实际应用中在线计算通常不会遍历所有的用户或者用户所有的浏览记录,只能截取一小部分用户及一小部分用户的浏览记录,依据几个共同的浏览记录来判断相似兴趣的用户群体,而这些浏览记录的产生很可能是偶然发生而非兴趣类似导致。因此,以此为据进行推荐往往准确率不高,并且很难将推荐理由介绍给被推荐用户。另外,对于新用户来说,由于缺乏该用户的浏览记录,故很难预测其感兴趣的内容,推荐系统会遇到冷启动现象。
发明内容
有鉴于此,本发明的主要目的是提供一种基于用户轨迹的协同过滤推荐方法、装置及系统,以解决现有技术中协同过滤推荐方法推荐准确率不高的问题。
为解决上述问题,本发明提供的技术方案如下:
一种基于用户轨迹的协同过滤推荐方法,所述方法包括:
获得移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;
获得并保存所述用户的浏览记录;
根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果。
相应的,所述比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,包括:
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹直接相交区域面积大于第三阈值的其他用户确定为所述目标用户的近邻用户;
比较目标用户与其他用户的用户轨迹,将用户轨迹与所述目标用户的用户轨迹间接相交区域面积大于第四阈值的其他用户确定为所述目标用户的近邻用户。
相应的,所述根据所述目标用户与所述近邻用户的所述浏览记录,利用协同过滤算法,为目标用户提供推荐结果,包括:
根据所述目标用户与所述近邻用户的所述浏览记录,计算所述目标用户与每个近邻用户的兴趣相似度;
确定所述近邻用户中与所述目标用户中兴趣相似度大于第五阈值的用户为所述目标用户的兴趣相似用户;
根据所述兴趣相似用户的浏览记录,获得为目标用户提供的推荐结果。
相应的,所述方法还包括:
当所述地理位置坐标数据不断增加,利用机器学习,调整第一阈值和/或第二阈值的取值范围。
相应的,所述方法还包括:
将所述用户化分为若干组;
在为不同组用户中的所述目标用户分别提供推荐结果的过程中,设置不同的所述第三阈值、所述第四阈值和/或所述第五阈值;
获得不同组的目标用户的推荐结果转化率;
根据所述不同组的目标用户的推荐结果转化率,调整所述第三阈值、所述第四阈值和/或所述第五阈值。
一种基于用户轨迹的协同过滤推荐装置,所述装置包括:
第一确定单元,用于获取移动终端的位置信息,根据所述位置信息确定用户的地理位置坐标;
第二确定单元,用于对由所述地理位置坐标确定的位置点进行聚类,确定所述用户的用户轨迹,所述用户轨迹为半径小于第一阈值且所述位置点密度大于第二阈值的区域;
第三确定单元,用于比较目标用户与其他用户的用户轨迹,确定所述目标用户的近邻用户,所述目标用户为所述用户中待提供推荐结果的用户;
第一获得单元,用于获得并保存所述用户的浏览记录;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310030471.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:时尚多功能椅
- 下一篇:社交网络意见领袖识别方法