[发明专利]一种基于用户当前地理位置和物理环境的音乐推荐方法有效
申请号: | 201210349719.7 | 申请日: | 2012-09-20 |
公开(公告)号: | CN102890713A | 公开(公告)日: | 2013-01-23 |
发明(设计)人: | 陈珂;胡天磊;夏飞;寿黎但;陈刚 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 周烽 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 当前 地理位置 物理 环境 音乐 推荐 方法 | ||
技术领域
本发明涉及空间数据库领域的索引机制与查询方法,以及信息检索领域针对海量多媒体对象的检索推荐技术,尤其涉及一种基于用户当前地理位置和物理环境的音乐推荐方法。
背景技术
在空间数据库领域,为了快速、有效地访问海量空间数据,专家学者提出了大量的空间索引方法,常见的索引方法包括网格(Grid)、四叉树(Quad-Tree)、R-索引、R*树索引、K-D-B树索引、Hilbert曲线索引。在此基础上,更提出了各种各具特色的查询及其解决方案,如近邻查询、K近邻查询、连续近邻查询、反向近邻查询、最远邻居查询、skyline查询。这些空间索引通常以层次型的结构组织空间对象,从而支持高效的空间查询。以被广泛采用的R树为例,空间上位置相近的数据点被聚类到最小包围盒里,这些最小包围盒又根据空间局部性递归的进行聚类,直到到达根节点。
在信息检索领域,常见全文搜索引擎通常采用倒排文件(Inverted File)对文档对象进行索引,倒排文件以文档关键词作为索引,文档作为索引对象建立关键词-文档映射结构。当用户输入关键词进行检索时,搜索引擎可以利用倒排文件高效地获得包含此关键词的文档集合以及关键词在各个文档中出现的次数,从而便捷计算网页文档与用户查询之间的匹配程度,并按一定的排列顺序返回查询结果。现有的检索系统最常用的模型是向量空间模型,在该模型中每个文档d被映射为一个特征向量V(d)=(t1,t2,t3…tn),其中ti(i=1…n)为一列互不相同的Tag在文档d中的权重,在信息检索领域最常用的Tag权重计算方法为TF-IDF。使用向量空间模型就能计算任意文档和用户查询之间的匹配度,首先把用户查询转换成位于同一个文档空间的向量,然后使用诸如余弦距离等计算函数计算匹配度。
在音乐推荐领域,根据方法的不同,传统的音乐推荐系统大概可以分为两类。一种是基于音乐内容(Content-Based)的,这种方法首先从用户喜欢的音乐中提取出各种特征,然后根据这些特征运用机器学习的方法判断用户对于其他音乐的喜好程度;另一种是协同过滤(Collaborative-Filtering),它假设相似的用户喜欢的音乐也是相似的,因此推荐给用户的是其他有着相似兴趣的用户所喜欢的音乐。但是大多数的推荐系统并没有考虑用户当时所处的上下文环境,推荐出来的音乐并不能满足用户当时的心理需求,因为很多用户其实是根据当时所处场合、发生事件或者物理环境状况而不是歌手等来选择音乐的。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于用户当前地理位置和物理环境的音乐推荐方法。
本发明的目的是通过以下技术方案来实现的:一种基于用户当前地理位置和物理环境的音乐推荐方法,包括如下步骤:
(1)从照片网站爬取具有GPS信息的照片集;
(2)从音乐网站爬取包含歌词等相关信息的音乐集;
(3)对步骤1)得到的具有GPS信息照片集建立空间索引,在此过程中对每张照片的原始Tag集进行分词处理得到规范的照片Tag集;
(4)对步骤2)得到的包含歌词等相关信息音乐集建立存储索引,在此过程中对每首歌曲的歌词进行分词得到对应的音乐Tag集和相应的音乐文档向量;
(5)分析文档集得到一个Tag相似度矩阵;
(6)通过查询步骤5)得到的Tag相似度矩阵将步骤3)得到的每张照片的Tag集转换成位于音乐文档向量空间的照片文档向量;
(7)将步骤4)得到的音乐文档向量和步骤6)得到的照片文档向量用TF-IDF权重计算方式转换成带权音乐文档向量和带权照片文档向量;
(8)客户端接收用户的当前位置信息和物理环境信息,传递给服务器进行计算;
(9)服务器根据从步骤8)得到的用户位置信息通过步骤3)建立的照片集索引查询出用户位置包含的所有照片得到位置相关照片集,同时对从步骤8)得到的物理环境信息进行加强得到代表用户当前物理环境的带权Tag集;
(10)使用步骤9)得到的代表用户物理环境的带权Tag集对音乐进行过滤得到候选音乐集;
(11)根据步骤9)得到的位置相关照片集所包含的照片Tag集计算出代表用户位置的带权文档向量,并用向量相似度计算方法计算出和其最匹配的K首音乐;
(12)基于步骤9)得到的位置相关照片集所包含的照片Tag集计算出相应的标签云,最后将查询出的K首音乐和生成的标签云返回给客户端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210349719.7/2.html,转载请声明来源钻瓜专利网。