[发明专利]信息推荐方法和装置有效
申请号: | 201610305668.6 | 申请日: | 2016-05-10 |
公开(公告)号: | CN107357793B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 郑子彬 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;中山大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 推荐 方法 装置 | ||
本发明涉及一种信息推荐方法和装置,所述方法包括:根据跨领域的用户数据提取用户标签;将相同用户的所述用户标签形成用于描述所述用户的用户标签集;根据主题生成模型和所述用户标签集确定所述用户标签集所属主题,并将所述用户标签集所属主题作为用户所属用户社区;根据所述用户所属用户社区进行信息推荐。本发明提供的信息推荐方法和装置,在数据稀疏度高的情况下可根据跨领域的用户数据,利用主题生成模型准确地确定用户所属用户社区,从而再利用用户所属用户社区进行信息推荐,可以在数据稀疏度高的情况下仍然进行准确的信息推荐。
技术领域
本发明涉及计算机技术领域,特别是涉及一种信息推荐方法和装置。
背景技术
随着互联网的发展,信息快速增长,如何对信息进行有效的筛选和过滤,将用户感兴趣的信息,比如电影、商品或者食物等信息,准确地推荐给用户是一个重要的研究题目。
目前普遍使用的推荐算法包括基于相似性的协同过滤算法、矩阵分解等,此类算法基于相似用户或者相似项目等各种类型信息,实现某用户对某项目的个性化喜爱程度的预测,从而达到个性化推荐的效果。
然而,目前的推荐算法只使用用户的单个活动场景的数据,具有局限性,特别是在数据稀疏度高的情况下,推荐效果差。比如购物网站上的物品可以达到上百万件,但是与某一用户有关系(比如浏览、购买等)的商品可能只有几十件。以用户和物品这两个维度来构建关系矩阵的话,横轴代表用户,纵轴代表商品。如果用户浏览或购买某一个商品,其矩阵中对应值为1,否则为0,那么这个矩阵几乎都是0。这样的情况下用协同过滤等一些传统的算法就非常的低效,预测不准确,导致推荐结果也不准确。
发明内容
基于此,有必要针对目前的推荐算法在数据稀疏度高的情况下推荐结果不准确的问题,提供一种信息推荐方法和装置。
一种信息推荐方法,所述方法包括:
根据跨领域的用户数据提取用户标签;
将相同用户的所述用户标签形成用于描述所述用户的用户标签集;
根据主题生成模型和所述用户标签集确定所述用户标签集所属主题,并将所述用户标签集所属主题作为用户所属用户社区;
将概率最大的主题确定为用户所属用户社区;
根据所述用户所属用户社区进行信息推荐。
一种信息推荐装置,所述装置包括:
用户标签提取模块,用于根据跨领域的用户数据提取用户标签;将相同用户的所述用户标签形成用于描述所述用户的用户标签集;
用户所属用户社区确定模块,用于根据主题生成模型和所述用户标签集确定所述用户标签集所属主题,并将所述用户标签集所属主题作为用户所属用户社区;将概率最大的主题确定为用户所属用户社区;
信息推荐模块,用于根据所述用户所属用户社区进行信息推荐。
上述信息推荐方法和装置,利用跨领域的用户数据来提取用户标签,同一用户的用户标签构成描述用户画像的用户标签集,这样每个用户标签集都可以准确地代表相应的用户。主题生成模型是处理自然语言的一种工具,利用该主题生成模型确定的用户所属用户社区,可准确表示出用户所在的用户社区,可表达用户与其它用户共有的特征。再利用用户所属用户社区进行信息推荐,便可以在数据稀疏度高的情况下仍然进行准确的信息推荐。
附图说明
图1为一个实施例中信息推荐系统的应用环境图;
图2为一个实施例中服务器的内部结构示意图;
图3为一个实施例中信息推荐方法的流程示意图;
图4为一个实施例中根据跨领域的用户数据提取用户标签的步骤的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;中山大学,未经腾讯科技(深圳)有限公司;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610305668.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据解析的方法和装置
- 下一篇:优化键值数据库的数据存储结构的方法和装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置