[发明专利]一种基于多马尔可夫链的内容推荐方法有效
申请号: | 201010182844.4 | 申请日: | 2010-05-26 |
公开(公告)号: | CN101826114A | 公开(公告)日: | 2010-09-08 |
发明(设计)人: | 陈振宇;封煜佳;王浩然;刘嘉;吴一帆 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 黄明哲 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多马尔可夫链 内容 推荐 方法 | ||
技术领域
本发明涉及个性化推荐技术领域,根据用户的兴趣特点、行为以及个人资料向用户推荐感兴趣的商品和信息。个性化推荐基于海量的数据挖掘,常用于电子商务以及社会型网络应用,可以在庞大的数据中为用户推荐其所感兴趣的信息和商品,减少浏览的时间。本发明具体为一种基于马尔可夫链并结合用户背景信息的内容推荐方法。
背景技术
个性化推荐技术是一个有巨大应用价值的技术。个性化推荐技术近年来不断的被各种电子商务型网站以及社会型网站所应用,为用户提供他们所感兴趣的信息和商品。个性化推荐技术最早是在1995年被提出来的。此后不断的被发展应用于电子商务领域,并为电子商务网站带来了巨大的利益,如亚马逊。近年来许多的社会型网络应用也不同程度的使用了推荐系统,比如豆瓣,用以为用户推荐感兴趣的信息。
个性化推荐技术的方法主要包括以下三种:
1)基于关联规则的推荐算法;
2)基于内容的推荐算法;
3)协同过滤推荐算法。
基于关联规则的推荐算法,首先挖掘关联规则形成规则库,然后为用户提供相应的推荐项目,但其可扩展性不能满足需求。
基于内容的推荐算法是定义项目与项目之间的相似度,然后为用户推荐与其所浏览或感兴趣过的项目相似的项目。但是这样的算法在对音乐,电影等很难提取内容的项目时有非常大的难度。并且基于内容的推荐算法只能发现相似的项目,但是无法推荐用户可能有兴趣的其他类项目。
协同过滤推荐算法则是在用户群中寻找相似的用户,然后综合这些相似用户对某一项目的评价来预测该用户对这个项目喜好程度。协同过滤算法是一项比较受欢迎的技术。它可以对比较复杂的项目比如音乐、电影进行推荐,同时也能够保证推荐的新颖性。但是用户的评价信息有时候非常稀疏,可能导致用户的相似性并不准确,从而使得所推荐的项目并不为用户所喜爱。同时协同过滤推荐算法的性能在用户以及项目数量大幅增加后可能会比较低。
发明内容
本发明要解决的问题是:现有的个性化推荐技术的方法存在不同程度的不足,对于用户可能感兴趣的项目不能做到全面推荐,不能克服推荐算法中的可扩展性问题和稀疏性问题。
本发明的技术方案为:一种基于多马尔可夫链的内容推荐方法,通过网站获取用户点击流数据,以及用户背景信息,对其进行分析,并生成内容推荐模型;当一个用户产生新的点击流时,利用当前的点击流数据以及内容推荐的模型产生用户可能感兴趣的项目,并推荐给用户;包括以下步骤:
1)、原始模型建立:建立原始模型,包括每个用户的马尔可夫模型,用户关系矩阵以及用于评价聚类结果好坏的聚类准则函数;
2)、模型学习阶段:使模型进行学习,合并相似的马尔可夫模型,并利用背景相似用户的点击数据填充合并后马尔可夫模型的的零行,也就是缺省信息;
3)、用户推荐:利用用户当前的点击以及所处组别的模型,进行推荐。
本发明步骤具体为:
1)、原始模型建立:
1.1)、记录并提取每个用户的点击流数据,所述点击流信息是基于控件的点击流信息;
1.2)、利用点击流数据对每个用户建立马尔可夫模型,包括转移矩阵A和初始状态λ,用户集合G:
转移矩阵A中,每个页面X表示模型的一个状态,Xt表示当前状态,Xt-1则表示前一刻的状态,设Pij=(Xt=xj|Xt-1=xi),0<i<n,0<j<n,n为总用户数,即Pij表示由状态xi转移到状态xj的概率,当A所指向的用户没有点击过页面Xt时,出现Pt1,Pt2,……Ptn,这一行无法计算,设置为零行,
初始状态λ=(pi)=(pi2,pi2…pin);
当马尔可夫模型仅由用户u1的点击流数据建立时,用户集合即为G={u1};
1.3)、从网站注册用户的注册文件中获得用户背景信息,包括用户年龄、性别、学历、工作、地域,根据这些用户背景信息来建立用户关系矩阵,并利用用户背景信息确定用户之间的相似性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010182844.4/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法