[发明专利]POI推荐模型的构建方法及系统在审
申请号: | 201811454774.6 | 申请日: | 2018-11-30 |
公开(公告)号: | CN111259268A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 王新珩;伊雷·内择瑞安汗择;陈涛;玛德塞·伊克巴尔 | 申请(专利权)人: | 知谷(上海)网络科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;黄谦 |
地址: | 200439 上海市宝山区逸仙*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | poi 推荐 模型 构建 方法 系统 | ||
1.一种POI推荐模型的构建方法,包括:
获取多个用户在社交网络中的历史签到数据集,其中,所述历史签到数据集至少包括:签到时间、签到地址的信息;
根据所述历史签到数据集内的签到时间、签到地址的信息确定所述用户的POI特征集合;
提取所述POI特征集合中的至少一个POI特征,确定多个子模型训练集;
通过监督模型对所述多个子模型训练集分别训练对应的POI概率估计,根据自决策树对所述POI概率估计迭代更新,当所述POI概率估计达到或超过预设阈值时,确定多个POI推荐子模型;
根据应用加法聚集所述多个POI推荐子模型,以构建POI推荐模型。
2.根据权利要求1所述的方法,其中,所述签到地址的信息包括:签到地址名称、签到地址类别、签到地址坐标;
所述POI特征集合包括:
根据单个用户在各签到地址名称以及签到地址类别的签到次数,确定所述单个用户的POI偏好以及类别偏好;
根据所述多个用户在各签到地址名称以及签到地址类别的签到次数,确定各签到地址的POI流行度;
根据所述单个用户在预设签到时间内相邻的签到地址的信息,确定所述单个用户的POI转换偏好以及类别转换偏好;
根据所述多个用户在预设签到时间内相邻的签到地址的信息,确定各签到地址的POI转换流行度以及类别转换流行度,其中,所述预设签到时间还包括:小时、星期,确定所述各签到地址的POI时间感知流行度以及类型时间感知流行度;
根据所述签到地址坐标,确定各签到地址间的地理距离。
3.根据权利要求2所述的方法,其中,所述提取所述POI特征集合中的至少一个POI特征,确定多个子模型训练集包括:
通过预先指定簇的数量阈值,根据各签到地址的地址坐标对所述各签到地址进行聚类;
根据各聚类类别内各签到地址的签到次数确定各聚类类别的多个POI特征,从而确定多个子模型训练集。
4.根据权利要求1所述的方法,其中,所述历史签到数据集包括训练数据集以及验证数据集,其中,所述训练数据集用于确定用户的POI特征集合。
5.根据权利要求4所述的方法,其中,在根据所述训练数据集确定的用户的POI特征集合之后,所述方法还包括:
根据所述POI特征集合确定多个POI推荐子模型;
通过验证数据集对所述多个POI推荐子模型进行校验,确定所述多个POI推荐子模型中的部分有效POI推荐子模型;
根据所述部分有效POI推荐子模型修剪所述多个POI推荐子模型,以减少过度拟合。
6.一种POI推荐模型的构建系统,包括:
历史签到数据集获取程序模块,用于获取多个用户在社交网络中的历史签到数据集,其中,所述历史签到数据集至少包括:签到时间、签到地址的信息;
POI特征集合确定程序模块,用于根据所述历史签到数据集内的签到时间、签到地址的信息确定所述用户的POI特征集合;
子模型训练集确定程序模块,用于提取所述POI特征集合中的至少一个POI特征,确定多个子模型训练集;
POI推荐子模型确定程序模块,用于通过监督模型对所述多个子模型训练集分别训练对应的POI概率估计,根据自决策树对所述POI概率估计迭代更新,当所述POI概率估计达到或超过预设阈值时,确定多个POI推荐子模型;
POI推荐模型确定程序模块,用于根据应用加法聚集所述多个POI推荐子模型,以构建POI推荐模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于知谷(上海)网络科技有限公司,未经知谷(上海)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811454774.6/1.html,转载请声明来源钻瓜专利网。