[发明专利]基于机器学习统计模型的入住酒店附近生活推荐系统方法有效
| 申请号: | 201710473308.1 | 申请日: | 2017-06-21 | 
| 公开(公告)号: | CN107291888B | 公开(公告)日: | 2020-12-01 | 
| 发明(设计)人: | 刘洋 | 申请(专利权)人: | 苏州发飚智能科技有限公司 | 
| 主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/906;H04L29/08 | 
| 代理公司: | 北京远创理想知识产权代理事务所(普通合伙) 11513 | 代理人: | 卫安乐 | 
| 地址: | 215522 江苏省苏州市苏州工业*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 基于 机器 学习 统计 模型 入住 酒店 附近 生活 推荐 系统 方法 | ||
1.一种基于机器学习统计模型的入住酒店附近生活推荐系统,其特征在于,包括:
信息采集模块:用于对用户数据进行采集;对城市地理位置对应相关信息的采集;以及对地图APP程序POI数据采集;
数据存储模块:用于对数据进行分类存储,按照格式化的方式存储;存储采集模块采集到的数据以及经过算法模块计算后的数据;所述数据存储模块:用于获取到三个方面用户地理坐标经纬度数据;包括当前住房用户的历史经纬度数据,住房附近N公里内全部用户历史经纬度数据,房屋所在城市全部用户历史经纬度数据;数据存储在分布式Hive表中,通过Hive表获取可以获取三个月的历史地理经纬度坐标数据对(记做lat,lng)作为训练样本;
算法模块:采用算法DBScan在对数据进行计算和训练;
匹配策略模块:执行用户和住所,用户和城市的兴趣地点匹配策略;
该匹配策略按照业务逻辑、用户兴趣或用户反馈城市天气进行不同的或者几种结合的策略;所述匹配策略模块进一步包括:用户的地理兴趣标签按照时间排序,将时间段划分为:清晨,上午,中午,下午,晚上;根据不同时间段划分将用户地理兴趣点分类标签也按照时间划分;将划分后的兴趣地理信息标签与住房附近的兴趣标签和城市地理兴趣标签进行匹配;匹配就是找相同的标签;提取出住房附近的相同标签,整个城市的相同标签;
推荐引擎模块:用于将所述匹配的兴趣地点坐标数据展示给用户;所述推荐引擎模块进一步包括:根据匹配标签查询住房附近,整个城市对应的聚类地理中心点和中心点的相关地理资料信息,按照用户出行的时间划分排序推荐给用户。
2.根据权利要求1所述的系统,其特征在于,所述格式化数据包括:用户ID,用户经度,用户纬度,用户到达地点的时间。
3.根据权利要求2所述的系统,其特征在于,所述算法模块:采用Dbscan密度聚类算法,做经纬度聚类计算;
按顺序取一个经纬度坐标lat,lng对记为点P1,从这个坐标点出发,找到这个坐标附近距离小于E的全部经纬度坐标点;E是最小距离参数;
其中最小距离阈值E是输入参数;坐标点的距离是用欧氏距离来计算的欧氏距离公式:
公式中的xik,xjk为坐标点信息;其中k为空间的维度数,k=1……m;
这个P1点和全部的经纬度坐标点都计算距离后,将距离按照从小到大的顺序排序找到距离小于E值的全部坐标点,如果小于阈值E的坐标点个数达到阈值G个,其中的G是算法输入参数设置一个范围内聚集多少个坐标点;将这些点群记为M1,那么点P1和点群M1算作一范围的群体,算法再继续找第二个点P2用同样的方法算第二个范围的群体M2,一直下去计算全部的经纬度点和相应的点,找到全部的点群;再计算点群与点群之间的距离,该距离仍然根据欧氏距离计算,如果两个点群之间的距离小于E那么这两个点群就可以合并成一个点群,如果距离大于E那么这两个点群就是记做两个点群集合,经过循环迭代的计算可以把全部的经纬度点,按照距离的大小聚集成不同的点群集合。
4.根据权利要求3所述的系统,其特征在于,所述算法模块进一步包括:参数E和G的设置采用先估算大概值,然后通过网格搜索方式确定具体选值的方法来确定;最小距离阈值E的大小估算方法用实际的地理位置大小来估算;根据上面估算的E和G值,再通过网格搜索在估算范围内选择多个E多个G值进行多次试验的方式最终确定E和G的取值。
5.根据权利要求4所述的系统,其特征在于,所述算法模块进一步包括:聚类后的三种数据中都聚类了多个点的集合;现在对每一个集合求出一个对应的中心点;
计算方法一:
对聚到一个地理位置集合里的全部坐标点;
求经度最大值,最小值;计算平均值lng_avg=(lng_max-lng_min)/2
纬度最大值,最小值;计算平均值lat_avg=(lat_max-lat_min)/2
最后用经纬度平均值作为中心点;
计算方法二:
计算全部经纬度加和平均值,作为中心点;
根据上面两种方法观察数据选择一个效果相对好的之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州发飚智能科技有限公司,未经苏州发飚智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710473308.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:LNMP架构实现软件化的流程管理系统
 - 下一篇:一种数据存储方法及系统
 





