[发明专利]推荐方法及装置在审
申请号: | 201210322688.6 | 申请日: | 2012-09-04 |
公开(公告)号: | CN103678329A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 丁贵广;叶小伟;林运桢;文海龙 | 申请(专利权)人: | 中兴通讯股份有限公司;清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚;梁丽超 |
地址: | 518057 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推荐 方法 装置 | ||
技术领域
本发明涉及计算机数据处理领域,具体而言,涉及一种推荐方法及装置。
背景技术
随着多媒体业务以及电子商务的蓬勃发展,很多公司都积累了大量的用户数据,如何利用这些数据找出用户的使用倾向成为商家的迫切需求;同时,作为普通用户,如何从海量数据当中找出自己最需要的内容,也成为用户的急切需要。这些原因成为推动推荐技术发展的主要助力。而无论对于企业还是用户而言,对每个用户产生针对其使用特点的个性化推荐远远优于给所有用户同样的推荐内容。因此,个性化推荐成为推荐技术的主要发展方向。
协同过滤推荐技术已经成为个性化推荐领域的主流技术,其原理是根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性,或者是发现用户的相关性,然后再基于这些关联性进行推荐。
在交互电视(Interactive Personality TV,简称为IPTV)领域,用户的偏好信息主要来自于用户的浏览数据,利用这些数据我们可以构建虚拟打分矩阵,然后在此基础上使用协同过滤技术帮助用户进行个性化推荐。图1是根据相关技术的IPTV推荐方法的流程图,如图1所示,包括如下步骤:
步骤S102,从原始数据库中获取相关的浏览数据进行预处理。
步骤S104,根据浏览数据构建用户视频评分矩阵。
步骤S106,使用协同过滤算法帮助用户协同推荐。
然而用户因为各自喜好的不同,观看的视频数量是极其有限的,因此用户的浏览数据是具备稀疏性的;同时用户受主观情绪的影响,观看视频的行为具有一定程度的随机性,对视频的直接评价也具备不确定性,从而会导致虚拟打分矩阵的可靠性较低,因而完全依赖虚拟打分矩阵的传统方法的准确性也较低。
发明内容
本发明提供了一种推荐方法及装置,以至少解决相关技术中,协同过滤推荐技术的数据集具有稀疏性和随机性,导致推荐结果不能令人满意的问题。
根据本发明的一个方面,提供了一种推荐方法,包括:获取项的信息,其中,该信息用于判断是否向用户推荐该项,该信息包括以下至少之一:用户侧信息、项的相关性信息,用户侧信息包括获取到的用户对于项的评论,项的相关性信息包括以下至少之一:项本身的特性、项与除该项之外的其它项之间的相关性;根据上述信息确定是否将上述项推荐给用户。
优选地,获取用户侧信息包括:根据用户对项的评论和情感元素集合确定评论的分类,作为用户侧信息,其中,情感元素集合包括以下至少之一:词语、表情符号,分类包括:正评论、负评论。
优选地,根据用户对项的评论和情感元素集合确定评论的分类包括:将评论分割成短句,根据情感元素集合分别计算各个短句的得分;将各个短句的得分之和作为评论的得分,并根据评论的得分确定评论的分类。
优选地,在根据用户对项的评论和情感元素集合确定评论的分类之后,上述方法还包括:调整用户的所有评论的分类的比例,实现正评论数目与负评论数目相同;根据调整后得到的正评论和负评论,迭代更新情感元素集合。
优选地,在迭代更新情感元素集合之后,上述方法还包括:通过线性核心的支撑向量机对迭代更新过的情感元素集合进行学习;利用词频-逆向文件频率TF-IDF计算方法计算情感元素集合中每个特征的权重。
优选地,对于交互电视IPTV业务,项是视频,获取项的相关性信息包括:根据视频的画面色彩、亮度对视频进行镜头切分;选取各个镜头的关键帧;提取各个镜头的关键帧的边缘直方图,得到各个关键帧的特征向量;计算各个关键帧的特征向量间的距离,作为项的相关性信息。
优选地,在根据视频的画面色彩、亮度对视频进行镜头切分之前,上述方法还包括:对视频进行合并、转码处理。
优选地,上述信息还包括:评分矩阵、评分矩阵的权值矩阵,获取权值矩阵包括:将评分矩阵分解成两个秩较低的矩阵;计算两个秩较低的矩阵的乘积,并将乘积对评分矩阵逼近;根据两个秩较低的矩阵的特征向量对评分矩阵中的丢失项构造权值,并构造权值矩阵。
优选地,用户侧信息和项的相关性信息是矩阵的形式。
优选地,根据信息确定是否将项推荐给用户包括:对用户侧信息、项的相关性信息进行分解,确定用户侧特征矩阵和项侧特征矩阵;对用户侧特征矩阵和项侧特征矩阵进行迭代,使用户侧特征矩阵和项侧特征矩阵的乘积逼近评分矩阵;将乘积中对应于评分矩阵的丢失项的较高分值的项推荐给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司;清华大学,未经中兴通讯股份有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210322688.6/2.html,转载请声明来源钻瓜专利网。