[发明专利]一种基于Spark的旅游兴趣推荐系统及推荐方法在审
申请号: | 201710496944.6 | 申请日: | 2017-06-26 |
公开(公告)号: | CN107357845A | 公开(公告)日: | 2017-11-17 |
发明(设计)人: | 缪亚林;赵立怡 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 西安弘理专利事务所61214 | 代理人: | 成丹 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 spark 旅游 兴趣 推荐 系统 方法 | ||
1.一种基于Spark的旅游兴趣推荐系统,其特征在于,包括:
数据仓库模块(1),用于存储数据;
数据收集模块(2),将用户交互界面的数据进行收集,将收集到的数据存储到数据仓库模块(1)中;
推荐引擎组模块(3),从数据仓库模块(1)中提取数据,每个引擎都有自己的推荐策略;
结果处理模块(4),对推荐引擎组模块(3)输出的结果按照权重统一起来,并将最终的结果展示给游客;
评估模块(5),对推荐引擎组模块(3)的每一个引擎针对准确度和多样性进行评估,以便确定各个引擎的使用场景;
引擎管理模块(6),根据评估模块(5)的结果,动态的增加、删除推荐引擎,确定各个引擎的权重;
用户反馈处理模块(7),将用户交互界面的用户反馈数据收集,并将收集到的反馈数据发送至数据仓库模块(1)。
2.根据权利要求1所述一种基于Spark的旅游兴趣推荐系统,其特征在于,所述推荐引擎组模块(3)包括三个推荐引擎,分别是:
基于内容的推荐,利用了大学生导游描述文件;
基于人口统计学的推荐,利用了游客描述文件;
基于SVD的推荐,利用了游客评分文件;
三个推荐引擎之间采用模块化设计,根据情况线性添加、删除及实时的调整推荐系统的权值分布。
3.根据权利要求1所述一种基于Spark的旅游兴趣推荐系统,其特征在于,每一个所述推荐引擎都分为两部分,离线计算模块和在线计算模块。
4.根据权利要求3所述一种基于Spark的旅游兴趣推荐系统,其特征在于,所述推荐引擎的离线计算模块处理数据量和计算量较大的原始数据,采用Spark分布式计算框架,供在线计算时使用。
5.根据权利要求3所述一种基于Spark的旅游兴趣推荐系统,其特征在于,所述推荐引擎的在线计算模块与具体的推荐目标相关,计算量不大,在离线计算的基础上,以最快的速度给出推荐结果。
6.采用一种基于Spark的旅游兴趣推荐系统的推荐方法,其特征在于,数据收集模块(2)从用户交互界面获取用户数据User.dat、大学生导游数据Student.dat、用户打分记录Rating.dat存储到数据仓库模块(1),用户反馈处理模块(7)从用户交互界面收集反馈数据发送给数据仓库模块(1);
数据仓库模块(1)包括原始数据层、离线中间层、推荐结果层,原始数据层将数据集中的数据抽象后封装,以Prequet文件的形式存储于HDFS中以供推荐引擎组模块(3)调用;离线中间层基于原始数据层,离线中间层是将各个推荐引擎离线部分产生的中间计算结果存储在数据仓库中,与具体的推荐对象无关,目的是先提前计算好以便供推荐引擎组模块(3)在线计算使用;推荐结果层是各个推荐引擎基于离线中间层数据个性化推荐的结果数据存储于内存中;结果处理模块(4)将推荐结果层中存储的数据过滤排序后直接返回给用户交互页面;评估模块(5)对推荐引擎组模块(3)的推荐结果的准确性、新颖性进行评估,根据评估的评估模块(5)的结果,引擎管理模块(6)动态的增加、删除推荐引擎,确定各个引擎的权重,以便获取需要的准确性、新颖性信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710496944.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:离群点检测方法和装置
- 下一篇:关系图谱的展示方法以及装置