[发明专利]一种大数据驱动的供应链需求预测方法有效
| 申请号: | 201811555230.9 | 申请日: | 2018-12-19 |
| 公开(公告)号: | CN109784979B | 公开(公告)日: | 2023-06-16 |
| 发明(设计)人: | 王进;张浩;许景益;孙开伟;刘彬 | 申请(专利权)人: | 中交(厦门)电子商务有限公司 |
| 主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06Q30/0202 |
| 代理公司: | 广州海藻专利代理事务所(普通合伙) 44386 | 代理人: | 张大保 |
| 地址: | 361000 福建省厦门市软件*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 驱动 供应 需求预测 方法 | ||
1.一种大数据驱动的供应链需求预测方法,其特征在于,包括以下步骤:
101.对商品数据进行数据预处理操作;
102.根据商品历史销售数据划分数据集,统计商品历史一年每天的销量;然后过滤掉商品日销售量高于前三天商品日销售量均值3倍的天的数据;对过滤后的商品一年历史销售数据采用滑窗法构建多个训练窗口;
103.对划分的数据集进行特征工程构建操作包括:
1031.基础特征:包括商品销售价格、商品吊牌价格、商品在售天数、商品品牌、商品季节属性,其中连续型的属性首先可以直接作为特征处理;而对于不连续的属性,采取独热编码,编码后的特征全部为数值型,可作为特征处理;
1032.时序特征:对商品销量的最大值、最小值、均值、中位数、总和分别以最后1、2、3、5、7、10、14、21、28、35天的数据进行统计,以此来统计商品在不同时间内的销量信息;
1033.组合特征:LightGBM模型训练完成后可以输出特征的重要性,特征重要性越大,即判别性越高,使用基础特征和时序特征中特征重要性排名前40的特征构建了组合特征:将这40个特征两两相除可以得到1000个组合特征,然后使用LightGBM对这1000个组合特征单独训练模型,训练完成后得到特征重要性的排序,将特征重要性最高的前600个组合特征添加到原始特征体系中。
1034.排序特征:把时序特征里面统计的所有商品销量的最大值、最小值、均值、中位数和总和进行全局排序和局部排序,全局排序是指把所有商品放在一起进行排序,局部排序是指把同一类商品的进行排序;
104.对构建的特征进行特征选择,包括:
首先利用步骤104特征选择后的特征,构建ElasticNet Regression、catboost、XGBoost和LightGBM共四个模型,再分别计算四个模型的分数score,见公式(1),其中RMSE是模型的均方根误差,再通过公式(2)计算每个模型的线性加权融合的权重weight,i表示第几个模型,n表示模型数量,最后把四个模型的预测结果分别乘以模型对应的权重,再求和相加得到的值作为最终的预测结果;
105.建立机器学习模型,并进行模型融合操作;
106.通过构建的模型,预测商品未来一周的销量。
2.根据权利要求1所述一种大数据驱动的供应链需求预测方法,其特征在于:步骤101所述对商品数据进行数据预处理操作包括,将缺失的商品的价格和销量用同一类商品最近一周的价格和销量的均值进行填充。
3.根据权利要求1所述一种大数据驱动的供应链需求预测方法,其特征在于:在所述数据集中采用5折交叉验证的方式构建验证集,其中4份作为训练数据,1份作为验证数据。
4.根据权利要求1所述一种大数据驱动的供应链需求预测方法,其特征在于:步骤104所述特征选择包括首先在LightGBM模型训练完后输出特征重要性,对对特征重要性进行排序,选取特征重要性最大的400个特征,然后再用皮尔逊相关系数计算400个特征之间的相似度,如果两个特征相似度达到了90%及以上,则过滤掉这两个特征中特征重要度低的特征,最终剩下的特征就是特征选择后的特征。
5.根据权利要求1所述一种大数据驱动的供应链需求预测方法,其特征在于:还包括融合系数调优,在模型原有的权重基础上,分别按步长0.05进行增减,直到在验证集上的score分数不再提高为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中交(厦门)电子商务有限公司,未经中交(厦门)电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811555230.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





