[发明专利]一种数据分析方法和装置在审
申请号: | 201810796750.2 | 申请日: | 2018-07-19 |
公开(公告)号: | CN110738508A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 王鑫 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 11219 中原信达知识产权代理有限责任公司 | 代理人: | 张一军;张效荣 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标物品 时间段 销售 预测目标 计算机技术领域 方法和装置 数据分析 预测结果 指标预测 预测 成对 促销 转换 | ||
1.一种数据分析方法,其特征在于,包括:
根据往期所有物品的总销售指标预测目标时间段内所有物品的总销售指标;
根据往期目标物品所属品类的品类占比预测目标时间段内目标物品所属品类的品类占比;
根据往期目标物品在所属品类的销售指标占比预测目标时间段内目标物品在所属品类的销售指标占比;
根据目标时间段内的总销售指标、目标物品所属品类的品类占比以及目标物品在所属品类的销售指标占比预测目标物品的销售指标。
2.如权利要求1所述的方法,其特征在于,根据往期所有物品的总销售指标预测目标时间段内所有物品的总销售指标,包括:根据往期多个时间段内所有物品的总销售指标,按照如下预测公式预测目标时间段内所有物品的理论总销售指标,根据理论总销售指标预测目标时间段内所有物品的总销售指标:
式中,ordern表示目标时间段内所有物品的理论总销售指标;M表示往期的时间段数量,1≤M≤n-1;ordern-m表示第(n-m)个时间段内所有物品的总销售指标;αn-m表示第(n-m)个时间段内所有物品的总销售指标的权重;ε1表示预测偏差。
3.如权利要求2所述的方法,其特征在于,根据理论总销售指标预测目标时间段内所有物品的总销售指标,包括:根据理论总销售指标,按照如下修正公式预测目标时间段内所有物品的总销售指标:
order=ω1×ordern+ω2×μ×ordern-1
式中,order表示目标时间段内所有物品的总销售指标;μ表示预设的增幅比例,μ×ordern-1表示增幅量;ω1表示理论总销售指标的权重;ω2表示增幅量的权重。
4.如权利要求1所述的方法,其特征在于,根据往期目标物品所属品类的品类占比预测目标时间段内目标物品所属品类的品类占比,包括:
选取多个时间窗口,以各个时间窗口内多个品类的品类占比训练时序模型和GBRT模型;将训练好的时序模型和GBRT模型融合得到品类预测模型;以各个时间窗口内目标物品所属品类的品类占比作为输入,利用品类预测模型预测目标时间段内目标物品所属品类的品类占比。
5.如权利要求4所述的方法,其特征在于,品类预测模型为:
式中,y表示目标时间段内目标物品所属品类的品类占比;rhw表示时序模型预测的目标时间段内目标物品所属品类的品类占比,rgbrt表示GBRT模型预测的目标时间段内目标物品所属品类的品类占比;表示rhw的修正系数,表示rgbrt的修正系数;β1表示rhw的权重,β2表示rgbrt的权重,ε2表示品类预测模型的预测偏差。
6.如权利要求5所述的方法,其特征在于,和的取值满足如下条件:
式中,Sy表示第y个样本的真实值,B表示样本量,Q表示预设的阈值。
7.如权利要求4所述的方法,其特征在于,以各个时间窗口内多个品类的品类占比训练时序模型和GBRT模型之前,还包括:确认该所述多个时间窗口满足如下条件:
式中,xij为第i个品类在第j个时间窗口内的品类占比,为一组时间序列;σ,μ分别为第i个品类在各个时间窗口内的品类占比的标准差和均值;A为时间窗口的数量;γ,θ为弹性系数;I为示性函数,xij≤μ+θσ时I=0、xij>μ+θσ时I=1;P表示概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810796750.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种兑换码的领取方法和装置
- 下一篇:量化用户之间关联程度的方法和装置