[发明专利]运单派件耗时预测模型的构建方法、装置和计算机设备在审
| 申请号: | 202011352126.7 | 申请日: | 2020-11-27 |
| 公开(公告)号: | CN114547960A | 公开(公告)日: | 2022-05-27 |
| 发明(设计)人: | 魏丹婷;李炜;杨佩宜;杨金辉;杨志群 | 申请(专利权)人: | 顺丰科技有限公司 |
| 主分类号: | G06F30/27 | 分类号: | G06F30/27;G06Q10/04;G06Q10/08;G06F119/02 |
| 代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 运单 耗时 预测 模型 构建 方法 装置 计算机 设备 | ||
1.一种运单派件耗时预测模型的构建方法,其特征在于,所述方法包括:
获取运单的运单基础数据;所述运单基础数据为所述运单流转之前的数据;
分析所述运单基础数据中的各运单特征,筛选入模特征,获取所述入模特征对应的运单基础数据作为入模运单基础数据;
对所述入模运单基础数据进行异常数据处理,剔除异常数据,得到训练运单基础数据;
根据所述训练运单基础数据构建用于预测耗时的运单派件耗时预测模型。
2.根据权利要求1所述的方法,其特征在于,所述分析所述运单基础数据中的各运单特征,筛选入模特征,获取所述入模特征对应的运单基础数据作为入模运单基础数据,包括:
基于所述运单基础数据中各所述运单特征的平均耗时,对所述运单基础数据中的各所述运单特征进行方差分析,得到预选入模特征;
基于随机森林对所述预选入模特征进行二次筛选,得到入模特征;
获取所述入模特征对应的运单基础数据作为入模运单基础数据。
3.根据权利要求2所述的方法,其特征在于,所述基于所述运单基础数据中各所述运单特征的平均耗时,对所述运单基础数据中的各所述运单特征进行方差分析,得到预选入模特征,包括:
根据各所述运单特征的平均耗时,分别计算各所述运单特征的组间差异和组内差异;
分别确定各所述运单特征对应所述组间差异和所述组内差异的比值,以及根据所述组间差异和所述组内差异,分别确定各所述运单特征的拟合优度;
从各所述运单特征中筛选所述比值和所述拟合优度同时满足预设比值阈值和预设拟合优度阈值的特征,得到预选入模特征。
4.根据权利要求3所述的方法,其特征在于,所述基于随机森林对所述预选入模特征进行二次筛选,得到入模特征,包括:
分别计算各所述预选入模特征的第一袋外数据误差和第二袋外数据误差;
根据所述第一袋外数据误差和所述第二袋外数据误差,分别确定所述预选入模特征的特征重要度;
根据所述预选入模特征对应的所述特征重要度和所述拟合优度,计算所述预选入模特征的特征重要系数;
从所述预选入模特征中筛选所述特征重要系数满足预设系数阈值的特征,得到入模特征。
5.根据权利要求1所述的方法,其特征在于,所述对所述入模运单基础数据进行异常数据处理,剔除异常数据,得到训练运单基础数据,包括:
从所述入模运单基础数据中,确定特征类别数量大于数量阈值的运单特征;
根据特征类别数量大于数量阈值的运单特征的特征重要系数,确定特征类别数量大于数量阈值的运单特征的特征非重要系数;
计算特征类别数量大于数量阈值的运单特征所对应的各个特征类别的运单量分位数;
在对所述特征非重要系数进行平衡后,分别与各所述特征类别对应的所述运单量分位数进行比较;
剔除所述运单量分位数小于或等于平衡后特征非重要系数的所述特征类别所对应的入模运单基础数据,得到训练运单基础数据。
6.根据权利要求1所述的方法,其特征在于,所述对所述入模运单基础数据进行异常数据处理,剔除异常数据,得到训练运单基础数据,包括:
将同一运单对应的所述入模运单基础数据输入至利用路由数据训练好的耗时预测模型,分别得到各所述运单对应的预测耗时;
分别将各所述运单的实际耗时与所述预测耗时比对,确定各所述运单的误差耗时;
将所述误差耗时为正数且所述误差耗时在预设分位数以上的入模运单基础数据剔除,得到训练运单基础数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011352126.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种换热组件
- 下一篇:一种复合结构多孔膜的制备方法及其制备的复合结构多孔膜





