[发明专利]一种基于多马尔可夫链的内容推荐方法有效
| 申请号: | 201010182844.4 | 申请日: | 2010-05-26 |
| 公开(公告)号: | CN101826114A | 公开(公告)日: | 2010-09-08 |
| 发明(设计)人: | 陈振宇;封煜佳;王浩然;刘嘉;吴一帆 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
| 代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 黄明哲 |
| 地址: | 210093 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多马尔可夫链 内容 推荐 方法 | ||
1.一种基于多马尔可夫链的内容推荐方法,其特征是通过网站获取用户点击流数据,以及用户背景信息,对其进行分析,并生成内容推荐模型;当一个用户产生新的点击流时,利用当前的点击流数据以及内容推荐的模型产生用户可能感兴趣的项目,并推荐给用户;包括以下步骤:
1)、原始模型建立:建立原始模型,包括每个用户的马尔可夫模型,用户关系矩阵以及用于评价聚类结果好坏的聚类准则函数;
2)、模型学习阶段:使模型进行学习,合并相似的马尔可夫模型,并利用背景相似用户的点击数据填充合并后马尔可夫模型的的零行,也就是缺省信息;
3)、用户推荐:利用用户当前的点击以及所处组别的模型,进行推荐。
2.根据权利要求1所述的一种基于多马尔可夫链的内容推荐方法,其特征是具体为:
1)、原始模型建立:
1.1)、记录并提取每个用户的点击流数据,所述点击流信息是基于控件的点击流信息;
1.2)、利用点击流数据对每个用户建立马尔可夫模型,包括转移矩阵A和初始状态λ,用户集合G:
转移矩阵A中,每个页面X表示模型的一个状态,Xt表示当前状态,Xt-1则表示前
一刻的状态,设Pij=(Xt=xj|Xt-1=xi),0<i<n,0<j<n,n为总用户数,即Pij表示由状态xi转移到状态xj的概率,当A所指向的用户没有点击过页面Xt时,出现Pt1,Pt2,……Ptn,这一行无法计算,设置为零行,
初始状态λ=(pi)=(pi2,pi2…pin);
当马尔可夫模型仅由用户u1的点击流数据建立时,用户集合即为G={u1};
1.3)、从网站注册用户的注册文件中获得用户背景信息,包括用户年龄、性别、学历、工作、地域,根据这些用户背景信息来建立用户关系矩阵,并利用用户背景信息确定用户之间的相似性;
1.4)、建立评价聚类结果好坏的聚类准则函数,得到初始准则函数值Z;
2)、模型学习阶段:
2.1)、计算每个转移矩阵之间的两两相似度,然后确定所有马尔可夫模型之间的相似度;
2.2)、设定相似度阈值,合并相似度超过阈值的马尔可夫模型,并计算合并后的马尔可夫模型的转移矩阵以及初始状态,此时的用户集合G包含了合并的马尔可夫模型所代表的所有用户,同时删除被合并的马尔可夫模型
2.3)、根据步骤2.2)得到的合并的马尔可夫模型所代表的用户,在步骤1.3)得到的用户关系矩阵中查找相似的用户,由相似的用户构成集合GS;
2.4)、利用相似用户,即集合GS的用户的点击流信息来填充2.2)中得到的合并后的马尔可夫模型的转移矩阵的零行;
2.5)、计算合并后聚类的准则函数:对步骤2.2)中每一种可行的马尔可夫模型合并方案都合并,并计算准则函数值,选择其中最大的准则函数值Z1,与初始准则函数值Z比较,若Z1>Z,则计算当前合并的马尔可夫模型的两两之间的相似度,回到步骤2.2)进行所有可行的合并,即二次合并,选取最大的二次合并的准则函数值Z2与Z1比较,若Z2>Z1则回到步骤2.2)进行三次合并,如此循环直至得到使准则函数值最大的合并,步骤2.4)得到的填充过的马尔可夫模型最终确定,进入步骤2.6);
2.6)、学习结束;
3)、利用模型进行用户推荐:
3.1)、用户产生新的点击流数据,记录该点击流数据用于下一次模型的学习;
3.2)、确定用户所处的马尔可夫模型,包括转移矩阵和初始状态;若用户为新用户,则根据用户关系矩阵,利用背景信息相似的用户生产马尔可夫模型;
3.3)、对用户当前的点击流数据以及相应的马尔可夫模型得到最热门的推荐,并显示给用户;
3.4)、结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010182844.4/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





