[发明专利]一种基于马尔科夫链的图书推荐方法有效
申请号: | 201210460908.1 | 申请日: | 2012-11-16 |
公开(公告)号: | CN102982131A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 廖建新;郭伟东;张雷;赵贝尔;崔晓茹 | 申请(专利权)人: | 杭州东信北邮信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 马尔科夫链 图书 推荐 方法 | ||
1.一种基于马尔科夫链的图书推荐方法,其特征在于,所述方法包括有:
步骤一、查询用户的阅读历史数据,并基于朴素贝叶斯算法,计算用户的初始状态概率向量: =( , ),其中, 、 分别是用户对图书的喜欢、不喜欢状态, 是用户当前阅读图书的标签向量, 、 分别是用户对图书的喜欢、不喜欢状态概率;
步骤二、查询用户的当前阅读图书和所有未阅读图书,并根据所有用户对该用户的当前阅读图书和未阅读图书的喜欢和不喜欢状态,分别计算该用户当前阅读图书到每个未阅读图书的转移概率矩阵;
步骤三、根据用户的初始状态概率向量、和用户当前阅读图书到未阅读图书的转移概率矩阵,分别计算用户从当前阅读图书转移到每个未阅读图书的状态概率向量,所述状态概率向量包括有用户对未阅读图书的喜欢状态概率,并据此向用户推荐未阅读图书。
2.根据权利要求1所述的方法,其特征在于,所述步骤一中, 的计算公式如下,j=0表示喜欢,j=1表示不喜欢: ,其中, 是用户喜欢或不喜欢图书的情况下对应图书标签的概率, 是用户喜欢或不喜欢一本图书的先验概率, 是一个根据图书自身属性信息而定义的常量。
3.根据权利要求2所述的方法,其特征在于,所述 的计算公式是: ,其中,n是用户的当前阅读图书包含的标签总数, 是用户的当前阅读图书所包含的标签k, 是用户喜欢或不喜欢标签k的概率。
4.根据权利要求3所述的方法,其特征在于,所述 的计算公式是: ,其中, 是用户阅读过,并且喜欢或不喜欢的所有图书包含的标签总数, 是用户阅读过,并且喜欢或不喜欢的所有图书包含的标签k的总数。
5.根据权利要求2所述的方法,其特征在于,所述 的计算公式是: ,其中, 是用户喜欢或不喜欢的图书总数,S是用户阅读过的图书总数。
6.根据权利要求2所述的方法,其特征在于,根据用户的阅读历史数据来计算 和 的比例,并根据 ,即可计算出 和 具体数值。
7.根据权利要求1所述的方法,其特征在于,所述步骤二中,用户的当前阅读图书u到未阅读图书v的转移概率矩阵 ,其中, 是从喜欢图书u到喜欢图书v的状态转移概率, 是从喜欢图书u到不喜欢图书v的状态转移概率, 是从不喜欢图书u到喜欢图书v的状态转移概率, 是从不喜欢图书u到不喜欢图书v的状态转移概率。
8.根据权利要求7所述的方法,其特征在于,所述 的计算公式如下,i/或t=0表示对图书u/或v是喜欢状态,i/或t=1表示对图书u/或v是不喜欢状态: ,其中,U是连续读过图书u和v的用户总数, 是在连续读过图书u和v的用户中,由对图书u的状态i直接转移到对图书v的状态j的用户总数。
9.根据权利要求1所述的方法,其特征在于,所述步骤三中,用户从当前阅读图书u转移到未阅读图书v的状态概率向量 的计算公式如下: ,其中, 是用户的当前阅读图书u到未阅读图书v的转移概率矩阵。
10.根据权利要求9所述的方法,其特征在于, ,其中, 是用户对未阅读图书v的喜欢状态概率, 是用户对未阅读图书v的不喜欢状态概率。
11.根据权利要求10所述的方法,其特征在于,按照用户对未阅读图书的喜欢状态概率值的大小,对所有未阅读图书进行排序,并从中挑选出喜欢状态概率值最大的若干本图书向用户推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州东信北邮信息技术有限公司,未经杭州东信北邮信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210460908.1/1.html,转载请声明来源钻瓜专利网。