[发明专利]图书推荐系统和方法在审
申请号: | 201611035485.3 | 申请日: | 2016-11-22 |
公开(公告)号: | CN108090074A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 黄浩炜;金杰;雷向欣;许卫静 | 申请(专利权)人: | 上海阿法迪智能标签系统技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 胡美强;王聪 |
地址: | 200233 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图书推荐 数据挖掘算法 图书信息 图形数据库模块 数据源信息 接口模块 输出模块 算法 存储 服务器资源 关系数据库 数据流 运行效率 复杂度 数据源 联结 输出 | ||
本发明公开了一种图书推荐系统和方法,其中图书推荐系统包括依次以数据流联结的图形数据库模块、接口模块和输出模块;所述图形数据库模块采用Neo4j,所述Neo4j用于存储图书推荐所使用的数据源信息;所述接口模块用于将Neo4j中的数据源信息通过数据挖掘算法计算出待推荐的图书信息;所述输出模块用于输出所述待推荐的图书信息。本发明提供的图书推荐系统和方法采用Neo4j存储推荐算法的数据源,相对于关系数据库来说,可以更快、更高效地计算出推荐图书信息,并且基于Neo4j的数据挖掘算法能够有效降低算法的复杂度,降低对服务器资源的要求,能够有效提高了数据挖掘算法运行效率。
技术领域
本发明涉及电子商务网站中图书推荐技术领域,特别涉及一种图书推荐系统和方法。
背景技术
常见的推荐算法有基于内容的推荐、基于关联的推荐和协同过滤推荐等。基于内容的推荐算法能为具有特殊兴趣爱好的用户进行推荐,能够推荐新的或不是很流行的项目,该推荐算法已有较稳定的技术,但由于物品的属性有限,很难有效得到更多数据,物品相似度分析仅仅依赖于物品本身特征,没有考虑人对物品的态度。基于关联规则的推荐能发现新的兴趣点,不需要领域知识,算法第一步关联规则的发现最为关键,但该步非常耗时;此外商品名称的同义性问题也是关联规则的一个难点,个性化程度低。协同过滤算法原理简单,方便快捷,被广泛应用,但是随着网站的扩大与用户数量的增加,该算法也出现了很多挑战及问题,比如稀疏问题和扩展性问题。
由于各种推荐方法都有优缺点,所以在实际应用中,组合推荐经常被采用。比较流行的组合方法有:加权组合法、切换组合法、分区组合法和分层组合法。其中分区组合法采用多种推荐机制,并将不同的推荐结果分不同的区域显示给用户。亚马逊网,当当网等很多电子商务网站都是采用这种推荐方式。虽然组合方法尽其所能地为用户提供准确且丰富的推荐信息,但是并没有从根本上解决一些算法存在的问题,例如协同过滤的扩展性问题。而且组合方法用到的算法越多,计算难度就越大,对服务器的要求也就越高。当用户量达到一定程度时,不可避免地需要提高对服务器的成本投入以保证推荐信息的准确性。
推荐算法的效率除了与算法本身有关,还与算法所应用的数据源有关。一般的数据挖掘都是采用基于关系数据模型的数据仓库。关系数据模型建立在严格的数学基础上,具有较高的数据独立性和安全性,使用简单,是目前应用最广泛的数据技术。但是随着数据规模与数据复杂性的增加,关系模型已经无法满足某些领域的需要,如社交网络。当数据对象关联关系固定时,关系数据库可以很好地工作;然而当数据规模庞大,数据对象间的关系复杂且动态变化时,关系数据库就会面临很多问题。
发明内容
本发明要解决的技术问题是为了克服现有技术中电子商务网站在图书推荐时推荐准确性和效率无法同时兼顾且服务器投入成本较高的缺陷,提供一种能够有效兼顾图书推荐时准确性和运行效率且能降低成本的图书推荐系统和方法。
本发明是通过下述技术方案来解决上述技术问题:
一种图书推荐系统,其特点在于,包括依次以数据流联结的图形数据库模块、接口模块和输出模块;所述图形数据库模块采用Neo4j(面向网络的图形数据库),所述Neo4j用于存储图书推荐所使用的数据源信息;所述接口模块用于将Neo4j中的数据源信息通过数据挖掘算法计算出待推荐的图书信息;所述输出模块用于输出所述待推荐的图书信息。
本方案中,采用Neo4j图数据库作为图书推荐算法的数据源,创新性地引入了Neo4j图数据库而不是采用传统关系数据库进行关联推荐,由于Neo4j数据库将结构化数据,包括实体数据和关系数据存储在图上,即存储在节点和联系上,因此能够快速获取与某个节点的关联信息,而协同过滤和关联规则的推荐算法则需要获取不同实体之间的关联信息。因此推荐算法的数据源采用Neo4j相对于关系数据库而言,可以更快、更高效地计算出推荐图书信息。并且基于Neo4j的数据挖掘算法能够有效降低算法的复杂度,降低对服务器资源的要求,能够有效提高数据挖掘算法运行效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海阿法迪智能标签系统技术有限公司,未经上海阿法迪智能标签系统技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611035485.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可配置物料清单的转换方法及装置
- 下一篇:文本过滤的方法及装置