[发明专利]一种融合历史均值与提升树的商家客流量预测方法在审
申请号: | 201810485114.8 | 申请日: | 2018-05-18 |
公开(公告)号: | CN108648023A | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 白智远;吕品;温从威;杨锦浩;陈智 | 申请(专利权)人: | 上海电机学院 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 201100 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客流量预测 预处理 融合 对比分析 计算公式 权重系数 数据构建 行为数据 依赖关系 预测结果 加权和 时间段 树构建 树模型 预测 客流量 互联网 | ||
1.一种融合历史均值与提升树的商家客流量预测方法,其特征在于,包括以下步骤:
步骤1、对某一时间段的商家完整行为数据进行预处理,商家完整行为数据包括商家特征数据、用户支付行为数据和用户浏览行为数据;
步骤2、对经过预处理的数据构建特征,增加节假日数据及天气特征数据;
步骤3、基于历史均值与提升树构建客流量预测模型,包括以下步骤:
步骤301、分别对XGBoost与GBDT构建2个学习模型,对2个学习模型调整树的深度、学习率以及迭代次数的参数,确定XGBoost学习模型的学习率以及树的最大深度时,引入XGBoost学习模型中内置的cv函数;
步骤302、利用步骤2得到的数据对XGBoost学习模型与GBDT学习模型进行训练,设定预测日,计算预测日之前到某一天的平均客流量、销量增量;。
步骤4、把过去某一时间段的历史销量的相关度矩阵作为步骤3已训练的客流量预测模型的输入,将未来某一时间段的销量和XGBoost学习模型与GBDT学习模型的模型融合的权重系数Credit作为输出:
式中,是过去某一时间段的平均销量;Fuslast是过去某一时间段的销量,由此,将XGBoost学习模型、GBDT学习模型和历史均值模型得到的过去某一时间段的平均销量和销量值,分别代入权重系数Credit公式当中,求出相应的权重系数,最终,将训练得到的2组XGBoost学习模型和2组GBDT学习模型的不同结果分别与历史均值模型分别按求出的相应的权重系数的比例融合,得到预测未来某一时间段的客流量。
2.根据权利要求1所述的一种融合历史均值与提升树的商家客流量预测方法,其特征在于,步骤1中所述预处理包括以下步骤:
步骤101、剔除商家完整行为数据中商家开业前7天的数据以及销量中断前后3天的数据,将剩余数据分为训练集和测试集;
步骤102、去除训练集和测试集中的重复数据,利用基于规则的方法对训练集和测试集中去重后的数据进行归一化处理,从而消除短时间内单个用户大量购买而造成的异常数据;
对于由于特殊时间节点而造成的异常数据和难以预计的大幅波动而造成的异常数据,采用模型预训练方法剔除,即采用欠拟合算法对客流量预测模型进行预训练,清除数据中残差为10%和25%的数据。
3.根据权利要求1所述的一种融合历史均值与提升树的商家客流量预测方法,其特征在于,所述步骤2包括以下步骤:
步骤201、采集全国各省市的天气数据;
步骤202、将天气状况简单转换为降水指数和天晴指数两个指标,并生成人体舒适度指数作为客流量预测模型训练的一个重要特征;
步骤203、采集当前时间段的节假日数据,将工作日标注为0,周末标注为1,假期标注为2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810485114.8/1.html,转载请声明来源钻瓜专利网。