[发明专利]基于item‑based的歌曲推荐优化方法及系统有效
申请号: | 201410757787.6 | 申请日: | 2014-12-10 |
公开(公告)号: | CN104504009B | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 赵淦森;何建涛;王欣明;周尚勤 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州嘉权专利商标事务所有限公司44205 | 代理人: | 郑莹 |
地址: | 510631 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 item based 歌曲 推荐 优化 方法 系统 | ||
技术领域
本发明涉及用于歌曲推荐的数据处理方法,尤其涉及一种基于item-based的歌曲推荐优化数据处理方法及系统。
背景技术
技术词解释:
基于物品的最近邻推荐(item-based):以物品为中心,寻找相似物品推荐给用户的方法。
余弦距离:也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。
多值评分:用户对物品的评分分值有多种情况,例如评分分值可以在1至5之间。
二元评分:用户对物品的评分分值只有两种情况,常见的情况是评分为0或1。
用户收藏行为数据:用户收藏歌曲的信息数据,即记录每个用户收藏了哪些歌曲。
用户收藏列表:用户收藏歌曲的列表信息,从用户收藏行为数据得出,例如:用户a收藏了歌曲A、歌曲B,则用户a的用户收藏列表中含有歌曲A和歌曲B。
MapReduce:一种编程模型,用于大规模数据集的并行运算。
目前,对于用于歌曲推荐这一领域的数据处理方法,其通常是采用基于物品的最近邻推荐(item-based)这一方法来实现的。在基于物品的最近邻推荐中,利用用户来描述物品,即表示为一个物品由一个用户评分向量列表来描述,然后再以用户评分向量列表来计算物品间的相似程度。而通过计算出的物品间的相似程度,进而实现歌曲的推荐。
而对于传统的基于物品的最近邻推荐这一方法,其计算物品间的相似程度的常用度量方式为余弦距离。在计算物品A和物品B之间的余弦距离时,即在计算物品A和物品B之间的相似程度时,其计算公式(1)如下所示:
其中,整个系统中涉及到n个用户,第i个用户对物品A的评分为Ai,第i个用户对物品B的评分为Bi。因此,在计算物品A与物品B之间的余弦距离过程中,需要读取物品A的用户评分列表[A1,A2,A3,……,An]和物品B的用户评分列表[B1,B2,B3,……,Bn]。
由上述可得,对于目前用于歌曲推荐这一领域的数据处理方法而言,无论用户评分类型是多值评分还是二元评分,现有的余弦距离计算中都需要读取物品的用户评分列表。然而,一首歌曲最多的情况下会被上百万个用户收藏,即用户评分列表的长度会超过百万,因此,若以用户评分列表来描述物品,即需要读取物品的用户评分列表,这样则会占用大量的内存空间。另外,由上述的计算公式(1)可知,物品间的余弦距离的计算公式复杂,即数据的处理步骤复杂,这样则会导致数据处理的速度慢,效率低,从而无法快速地实现歌曲推荐。
发明内容
为了解决上述技术问题,本发明的目的是提供一种基于item-based的歌曲推荐优化方法。
本发明的另一目的是提供一种基于item-based的歌曲推荐优化系统。
本发明所采用的技术方案是:基于item-based的歌曲推荐优化方法,其包括:
A、对多个用户收藏列表进行第一歌曲的检测,从而检测出第一歌曲的出现次数;
B、对多个用户收藏列表进行第二歌曲的检测,从而检测出第二歌曲的出现次数;
C、对多个用户收藏列表进行第一歌曲和第二歌曲的检测,从而检测出第一歌曲和第二歌曲的共同出现次数;
D、根据第一歌曲的出现次数、第二歌曲的出现次数以及第一歌曲和第二歌曲的共同出现次数,从而计算第一歌曲与第二歌曲之间的余弦距离。
进一步,所述步骤D中所述的计算第一歌曲与第二歌曲之间的余弦距离,其所采用的计算公式为:
其中,A表示为第一歌曲,B表示为第二歌曲,sim(A,B)表示为第一歌曲与第二歌曲之间的余弦距离,NA表示为第一歌曲的出现次数,NB表示为第二歌曲的出现次数,NAB表示为第一歌曲和第二歌曲的共同出现次数。
进一步,所述步骤A至步骤D均利用MapReduce软件来实现。
本发明所采用的另一技术方案是:基于item-based的歌曲推荐优化系统,其包括:
第一检测模块,用于对多个用户收藏列表进行第一歌曲的检测,从而检测出第一歌曲的出现次数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410757787.6/2.html,转载请声明来源钻瓜专利网。