[发明专利]一种基于组合算法的个性化图书推荐方法有效
申请号: | 201711149281.7 | 申请日: | 2017-11-18 |
公开(公告)号: | CN107943910B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 高建彬;单良 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951;G06K9/62 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 徐金琼;刘东 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 组合 算法 个性化 图书 推荐 方法 | ||
1.一种基于组合算法的个性化图书推荐方法,其特征在于,包括如下步骤:
S1:对图书的内容信息进行关键词提取,求得图书的特征向量;
S2:根据用户浏览或下载到的图书的特征向量求得用户的特征向量,再求得用户对某个新书的评分值;
S3:通过用户-图书实际行为数据对来统计每个用户的行为图书和每个图书的行为用户,生成“用户行为倒排表和查询索引”和“图书行为倒排表和查询索引”;
S4:根据用户的相同行为图书个数与各自行为图书个数计算两个用户之间的相似度,以及两本图书之间的相似度,生成相似度文件和查询索引:相似用户索引和查询索引、相似图书索引和查询索引;
S5:根据S3中生产的“用户行为倒排表和查询索引”和“图书行为倒排表和查询索引”,以及S4中生成的相似用户索引和查询索引、相似图书索引和查询索引计算给用户的图书推荐指数;
S51:针对每个用户,通过相似用户索引和查询索引查找相似用户结果倒排表,得到该用户的TOP N相似用户集合;
S52:根据S3中得到的用户行为倒排表和查询索引,找到每个相似用户的行为图书;
S53:对于这些找到的图书,计算每个推荐图书的推荐指数,推荐指数为top N相似用户对该图书的平均推荐指数;
所述每个用户在对一个图书的推荐指数步骤为:
在用户u浏览或下载的图书集合A中,任意的在集合A中的图书bi,在相似图书索引和查询索引中查找与图书bi最相似的K个图书,A集合的相似图书集合为B,每个相似图书bj与bi的相似度为simiBooks(bi,bj),经这个集合为B,用户u对于图书bj的推荐指数为:
其中,为用户u对bi的评分值,simiBooks(bi,bj)是bi和bj的图书相似度;
S54:对集合B的每本图书计算推荐指数,倒排序后生成推荐列表;
S55:过滤掉用户已经浏览或下载过的图书,得到最终推荐结果。
2.根据权利要求1所述的一种基于组合算法的个性化图书推荐方法,其特征在于,所述S1的具体步骤包括:
S11:抽取图书中的关键词,生成图书-关键词和关键词-图书两个倒排表;
S12:根据S11中图书-关键词和关键词-图书倒排表,使用TF-IDF的方法,计算关键词ki的词频TFij、以及倒排频率IDFi:其中,fij为关键词ki在一本图书Bj中出现的次数,Max(fj)表示所有的图书Bj中关键词出现的最大次数,n1表示关键词ki出现过的图书的数量,N为新书的数目;
S13:关键词ki在图书Bj中TF-IDF权重wij为TFij×IDFi;
S14:每本图书Bj的特征向量可以表示为:
3.根据权利要求1所述的一种基于组合算法的个性化图书推荐方法,其特征在于,S2中,用户的特征向量通过浏览或下载的图书的特征向量的平均值来表示为则用户与对某个新书的评分值可以用余弦公式计算得到:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711149281.7/1.html,转载请声明来源钻瓜专利网。