[发明专利]一种基于图书内容的图书推荐方法有效

专利信息
申请号: 201110447928.0 申请日: 2011-12-27
公开(公告)号: CN102542046A 公开(公告)日: 2012-07-04
发明(设计)人: 韩军 申请(专利权)人: 纽海信息技术(上海)有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06Q30/02
代理公司: 暂无信息 代理人: 暂无信息
地址: 201203 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 图书 内容 推荐 方法
【说明书】:

技术领域

发明涉及计算机技术领域,尤其涉及到基于内容的图书推荐方法。

背景技术

近年来,随着计算机与网络技术的进步,电子商务得到了快速发展,尤其是网上图书零售发展十分迅速。网上图书零售不但能给电子商务企业带来可观的收益,更重要的是能吸引人气,带来客户流量,它已经成为大型电子商务企业的核心业务之一。

由于网上书店可以在网站上呈现比实体书店更多的内容,为了帮助客户快速找到合适的图书,同时也为了吸引客户购买更多的图书,需要采用图书推荐系统自动为客户生成图书推荐。

目前,大多数的推荐系统都是针对商品类别进行分类,然后通过协同推荐或同类商品销售排行来进行推荐。其缺点有二:第一,这些推荐系统都是针对百货商品来分类的,没有针对图书内容做优化,仅仅只能将图书照搬百货商品的做法分门别类做推荐,导致推荐效果不佳;第二,其采用的协同推荐方法对于已经形成销售规模,具备大量销售数据的网站比较适用,但是对于刚刚上线的图书网站,由于缺少交易数据,难以形成有效的推荐。另外,目前很多的推荐系统都没有反映存货情况,向用户推荐的商品最终却缺货,显然会大大降低用户体验。

发明内容

有鉴于此,一种能反映图书内容,能够结合库存信息、促销信息的图书推荐方法是十分有益的。

为了解决上述问题,本发明提供了一种基于书名、作者、内容摘要、目录等信息,并结合库存数据和促销信息的图书推荐方法,其技术方案包括:

在新加入一本图书时,首先获取其内容信息,并将这些内容存为特征向量。比如,将书名存为特征向量dt,将作者存为特征向量da,将内容摘要存为特征向量ds,将目录存为特征向量dc。这些特征向量将进一步处理提取关键词和权重,并用于图书之间相关性计算的特征参数。

其次,针对上述4种特征向量分别进行特征词的提取和特征词的权重计算,计算结果表示为:

d=(w1,w2,...,wn)

其中,wi代表特征词i出现的次数也即特征词i的权重;

然后,利用基于权重融合的余弦相似度函数来计算图书间的相关性,计算公式如下:

C(Bx,By)=a×sim(dt,x,dt,y)+b×sim(da,x,da,y)

      +c×sim(ds,x,ds,y)+d×sim(dc,x,dc,y)

其中,C是图书之间的相关度,Bx By代表图书x和y,sim(dx,dy)是余弦相似度函数,a、b、c、d是不同特征向量的权重;融合图书的四种特征向量dt、da、ds、dc得到图书间基于内容的相关系数C。

接下来,根据和不同图书之间相关系数C的大小,选取相关系数最大的N本图书,得到该图书的推荐列表L0。

最后,结合库存数据和促销信息对L0重新排序得到最终的推荐列表L。

本发明还可以通过下述方法强化推荐效果:

上述基于权重融合的余弦相似度函数用于计算图书之间相关性,其权重取值设定为a=b=c=d=25%。

上述余弦相似度函数sim(dx,dy)用于计算项目dx和dy的相关程度,其计算公式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纽海信息技术(上海)有限公司,未经纽海信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110447928.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top