[发明专利]兴趣点新增率预测模型训练及预测方法、装置及存储介质有效
申请号: | 201711457811.4 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108182240B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 吴俊;柯海帆 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣 新增 预测 模型 训练 方法 装置 存储 介质 | ||
1.一种兴趣点POI新增率预测模型训练方法,其特征在于,包括:
针对作为训练样本的每个区域,分别获取所述区域的以下信息:
采集时刻所述区域的POI维度特征,所述采集时刻为将当前时刻减去第一预定时长得到的时刻;采集时刻所述区域的情报维度特征;从采集时刻到当前时刻的第一预定时长内,所述区域的POI新增率;
根据获取到的作为训练样本的区域的POI维度特征、情报维度特征以及POI新增率,训练得到POI新增率预测模型。
2.根据权利要求1所述的方法,其特征在于,
所述采集时刻所述区域的POI维度特征包括以下之一或任意组合:
采集时刻所述区域内的POI数量;
采集时刻所述区域内属于预先定义的易变类型的POI数量;
截至采集时刻,所述区域内建立时长大于第二预定时长的POI数量;
截至采集时刻,所述区域内建立时长小于第三预定时长的POI数量;
截至采集时刻的第四预定时长内,所述区域内的所有POI的点击热度之和。
3.根据权利要求1所述的方法,其特征在于,
所述采集时刻所述区域的情报维度特征包括以下之一或任意组合:
所述区域内在采集时刻之前曾存在wifi定位信息,但在截至采集时刻的第五预定时长内无wifi定位信息的POI数量;
截至采集时刻的第六预定时长内,所述区域内新增wifi定位信息的POI数量;
截至采集时刻的第七预定时长内,所述区域内根据获取到的快递订单信息中的发件地址和收件地址确定出的新增POI数量;
截至采集时刻的第八预定时长内,所述区域的POI新增率。
4.根据权利要求1所述的方法,其特征在于,
该方法进一步包括:
将全国的城市划分为N个类别,N为大于一的正整数,其中,每个城市分别被切分为一系列预定大小的区域;
针对每个类别,分别训练得到对应的POI新增率预测模型。
5.根据权利要求4所述的方法,其特征在于,
所述将全国的城市划分为N个类别包括:
针对每个城市,分别统计截至当前时刻的第九预定时长内所述城市中的所有POI的点击热度之和;
按照统计结果将全国的城市划分为N个类别,其中,属于第i类别的城市的统计结果大于属于第i+1类别的城市的统计结果,1≤i≤N-1。
6.一种兴趣点POI新增率预测方法,其特征在于,包括:
当需要对任一区域的POI新增率进行预测时,分别获取所述区域当前时刻的POI维度特征以及情报维度特征;
将获取到的特征输入预先训练得到的POI新增率预测模型,得到所述区域的POI新增率预测结果。
7.根据权利要求6所述的方法,其特征在于,
所述当前时刻的POI维度特征包括以下之一或任意组合:
当前时刻所述区域内的POI数量;
当前时刻所述区域内属于预先定义的易变类型的POI数量;
截至当前时刻,所述区域内建立时长大于第二预定时长的POI数量;
截至当前时刻,所述区域内建立时长小于第三预定时长的POI数量;
截至当前时刻的第四预定时长内,所述区域内的所有POI的点击热度之和。
8.根据权利要求6所述的方法,其特征在于,
所述当前时刻所述区域的情报维度特征包括以下之一或任意组合:
所述区域内在当前时刻之前曾存在wifi定位信息,但在截至当前时刻的第五预定时长内无wifi定位信息的POI数量;
截至当前时刻的第六预定时长内,所述区域内新增wifi定位信息的POI数量;
截至当前时刻的第七预定时长内,所述区域内根据获取到的快递订单信息中的发件地址和收件地址确定出的新增POI数量;
截至当前时刻的第八预定时长内,所述区域的POI新增率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711457811.4/1.html,转载请声明来源钻瓜专利网。