[发明专利]一种信息处理方法及装置在审
申请号: | 201310652300.3 | 申请日: | 2013-12-05 |
公开(公告)号: | CN104699693A | 公开(公告)日: | 2015-06-10 |
发明(设计)人: | 毛昊;钟伟锋;吴华;冼伟权;黄刚 | 申请(专利权)人: | 中国移动通信集团广东有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 510623 广东省广州市珠*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 | ||
技术领域
本发明涉及数据业务领域,特别是涉及一种信息处理方法及装置。
背景技术
“信息过载”问题随着信息技术的迅速发展和信息内容的增长而日益严重,推荐系统被认为是可以处理此问题的一种有效工具,近年来已经取得了不少研究成果。它通过挖掘用户所可能感兴趣的项目,并对用户进行推荐。目前,个性化推荐系统已经广泛应用于移动业务、电子商务,以及信息检索。尤其对于移动业务而言,随着移动电话用户数量的快速增加、移动通信技术的飞速发展以及移动增值数据业务的迅猛增长,带来了大量的数据业务与应用点,比如无线城市、移动旅游、手机报等。为了使用户在海量信息中能够及时、准确得到自己所需要的信息,就需要深入挖掘用户不同的兴趣,从而开展相应的业务推荐以增加活跃用户数比例是当前提高用户满意度和忠诚度的一大重要举措,个性化信息服务在移动应用中地位日益重要。
目前,个性化推荐技术中已经有很多成熟的方法,但现有的个性化推荐方法主要存在着如下缺陷:(1)只关注精确性问题:推荐算法仅仅关注于用户感兴趣的项目的精确度问题,只围绕着用户的偏好推荐,而忽视了用户偏好的扩展;(2)稀疏性,由于大规模的商品数量和为数众多的用户数量,而用户一般只对自己感兴趣的商品评分,所利用表示用户兴趣的信息是十分有限的,而用户未评分的商品是否是用户的潜在兴趣较难发现。针对此类问题有些方法提出扩展用户兴趣的思路,比如Tangent方法,此类方法存在着计算联系分时,需要重复计算每个节点彼此之间的相关性,而且只是从纯无向图的角度去建模,忽略了二分图中用户与用户之间没有联系的特点;Community-based方法是一种较复杂的协同过滤方法,它通过显式将用户与项目分类,从而直接推荐类外项目的思路,思路比较简单,但事先需要进行聚类、计算量比较大。
发明内容
本发明的目的在于提供一种信息处理方法及装置,用以解决现有推荐算法中不能充分挖掘用户的潜在偏好项目节点,项目推荐质量不高的问题。
为了实现上述目的,本发明提供了一种信息处理方法,包括:获取用户的项目评分数据集,所述项目评分数据集包括用户对项目的评分;
获得用户-项目评分数据集中每个节点与一待推荐用户节点的第一相关性权重Wi,所述第一相关性权重为同一类项目中的相关性权重;
计算用户-项目评分数据集中每个节点与所述待推荐用户节点的第二相关性权重We,所述第二相关性权重为不同类项目间的相关性权重;
根据所述We和所述Wi,得出每个节点的推荐度W;
根据所述推荐度W确定待推荐项目。
其中,上述信息处理方法,所述获得用户-项目评分数据集中一待推荐用户节点的第一相关性权重Wi的步骤包括:
根据用户-项目评分数据集建立项目二分图G=(V,E);其中,V=(V1,V2),V1表示用户节点;V2表示项目节点;E为边,边上的权值为用户对项目的评分;
选取所述二分图中的一用户节点作为所述待推荐用户节点;
计算所述二分图中每个节点与所述待推荐用户节点的第一相关性权重Wi。
其中,所述计算所述二分图中每个节点与所述待推荐用户节点的第一相关性权重Wi的步骤包括:
根据所述待推荐用户节点i,通过随机游走模型的方法迭代计算出概率分布向量R(t+1);
迭代收敛后,选取稳定的概率分布向量作为第一相关性权重Wi。
其中,所述根据所述待推荐用户节点i,通过随机游走模型的方法迭代计算出概率分布向量R的步骤具体为:
通过公式计算出R(t+1),即Wi=R(t+1);
其中,r为返回概率;ej为第j维为1的单位向量,为初始状态;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团广东有限公司;,未经中国移动通信集团广东有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310652300.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:提示信息获取方法和装置
- 下一篇:一种处理数据的方法和装置