[发明专利]POI推荐模型的构建方法及系统在审
申请号: | 201811454774.6 | 申请日: | 2018-11-30 |
公开(公告)号: | CN111259268A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 王新珩;伊雷·内择瑞安汗择;陈涛;玛德塞·伊克巴尔 | 申请(专利权)人: | 知谷(上海)网络科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;黄谦 |
地址: | 200439 上海市宝山区逸仙*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | poi 推荐 模型 构建 方法 系统 | ||
本发明实施例提供一种POI推荐模型的构建方法。该方法包括:获取多个用户在社交网络中的历史签到数据集;根据历史签到数据集内的签到时间、签到地址的信息确定用户的POI特征集合;提取POI特征集合中的至少一个POI特征,确定多个子模型训练集;通过监督模型对多个子模型训练集分别训练对应的POI概率估计,根据自决策树对POI概率估计迭代更新,当POI概率估计达到或超过预设阈值时,确定多个POI推荐子模型;根据应用加法聚集多个POI推荐子模型,以构建POI推荐模型。本发明实施例还提供一种POI推荐模型的构建系统。本发明实施例考虑了多个POI特征而不是所有的POI特征,相比于根据单个POI特征或所有POI特征时避免了过度拟合以及数据不足,使得推荐准确度更高。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种POI推荐模型的构建方法及系统。
背景技术
随着可以获取位置的设备和无线通信的发展,用户使用LBSN(location-basedsocial networks,基于位置的社交网络)的次数越来越多,例如,Foursquare、Gowalla、Facebook等。在LBSN中,用户可以通过签到,来彼此分享他们历史曾访问过位置的经历,这些经历(也就是用户所访问过的位置)也被称为POI(points-of-interest,兴趣点),例如用户签到的访问记录中有餐馆、商店和博物馆,这些访问的经历表明用户对这些地点的喜好。通过用户签到的数据从而了解用户的偏好,进而将其用于制作用户的POI建议。这将有助于用户探索新的地方,并使得LBSN对用户更加具有吸引力。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
现有的方法通常考虑用户访问POI的概率与地点的各特征(热度、地理位置、时间等)之间独立的关系,例如独立地模拟用户偏好与用户访问POI的概率、地理影响与用户访问POI的概率等,然后通过简单地融合各个独立关系的模型来得出最终结果。然而这种方法基于各特征的单独假设,即假设结果与用户签到的数据特征不匹配,因为这种方法仅仅考虑单独的特征。例如,可推荐的地点有:火锅店、烧烤店、粥铺,当在早上7点向用户推荐时,如果仅仅考虑用户对热度的需求(例如,火锅店热度最高),那么很有可能会向用户推荐火锅店。而根据人的生活作息,一大早通常不吃火锅、烧烤等食物,又或者不考虑地理位置特征,向用户推荐了距离用户10KM以外的粥铺a,而没有向用户推荐距离相对较近的粥铺b。
又或者,现有的全联合模型方法,该方法考虑用户访问的POI的概率与地点的各特征(热度、地理位置、时间等)之间所有特征相互的关系,例如,同时考虑到热度、地理位置、时间等所有特征,然后通过监督学习模型来预测用户可能访问的下一个top-k(概率最高的k个POI)的POI进行推荐。然而这种方法在使用中需要用户具有足够的历史签到数据。当用户在LBSN中签到的数据较少时,应用完整的模型可能会导致POI建议过度拟合,以至于准确性反而降低。
发明内容
为了至少解决现有技术中仅考虑独立特征的模型在POI推荐时没有将各特征之间的关系考虑在内而导致的推荐不准确以及将所有特征都考虑的全联合模型在签到数据较少时,过度拟合,POI推荐准确度较低的问题。申请人意外的发现用户在LBSN中的目的地是由同时起作用的多个特征驱动的,而不同的用户可能会受到不同特征的影响。通过结合多个这些会影响用户的特征进行监督学习,不去利用包含所有特征的复杂模型,而是利用这些会影响用户的部分特征的建立个性化部分模型,从而解决上述问题。
第一方面,本发明实施例提供一种POI推荐模型的构建方法,包括:
获取多个用户在社交网络中的历史签到数据集,其中,所述历史签到数据集至少包括:签到时间、签到地址的信息;
根据所述历史签到数据集内的签到时间、签到地址的信息确定所述用户的POI特征集合;
提取所述POI特征集合中的至少一个POI特征,确定多个子模型训练集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于知谷(上海)网络科技有限公司,未经知谷(上海)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811454774.6/2.html,转载请声明来源钻瓜专利网。