[发明专利]快递数据挖掘方法、装置、设备及存储介质在审

专利信息
申请号: 202110206391.2 申请日: 2021-02-24
公开(公告)号: CN112905665A 公开(公告)日: 2021-06-04
发明(设计)人: 陈玉芬;李培吉;李斯;夏扬 申请(专利权)人: 上海东普信息科技有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/215;G06F40/295;G06F16/31;G06F16/35;G06F40/216;G06Q10/08
代理公司: 北京市京大律师事务所 11321 代理人: 姚维
地址: 201700 上海市青浦区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 快递 数据 挖掘 方法 装置 设备 存储 介质
【说明书】:

发明涉及数据挖掘领域,公开了一种快递数据挖掘方法、装置、设备及存储介质。所述方法包括:获取原始快递数据,所述原始快递数据包括运单主体数据、商品主体数据、电商平台主体数据、商家主体数据和消费者主体数据;对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据;采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息;分别对所述目标数据中不同主体的关键信息进行相关性分析,得到所述目标数据中不同主体的关键信息之间的关联关系;根据所述关键信息和所述关联关系,更新各主体对应的主体画像。本发明能够完善快递行业各主体画像的数据,使各环节的服务质量得到提高。

技术领域

本发明涉及数据挖掘领域,尤其涉及一种快递数据挖掘方法、装置、设备及存储介质。

背景技术

快递行业作为电商经济的重要一环,连接着商品、卖家、平台、消费者和仓库等多个主体,每个主体都承载着大量的数据,并且跟随着货物的运输而流动。在大数据时代,信息即是价值,对于这些数据的有效利用成为了行业内新的机遇。

现今快递行业各环节主体的数据相互孤立,数据挖掘工作往往是由各主体独立进行,在数据量不足且互不关联的情况下,各主体都难以使数据的价值最大化,而快递环节作为各主体的连接者,如何充分挖掘出商品、卖家、平台、消费者、仓库等主体之间的关联关系,打通快递行业中各环节的数据孤岛,成为了亟需解决的技术问题。

发明内容

本发明的主要目的在于解决现有快递行业数据利用率较低而难以提升行业价值的技术问题。

本发明第一方面提供了一种快递数据挖掘方法,包括:

获取原始快递数据,所述原始快递数据包括运单主体数据、商品主体数据、电商平台主体数据、商家主体数据和消费者主体数据;

对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据;

采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息;

分别对所述目标数据中不同主体的关键信息进行相关性分析,得到所述目标数据中不同主体的关键信息之间的关联关系;

根据所述关键信息和所述关联关系,更新各主体对应的主体画像。

可选的,在本发明第一方面的第一种实现方式中,所述对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据包括:

依次执行多个预置脱敏脚本,以对所述原始快递数据中的敏感信息进行脱敏处理;

对脱敏后的数据进行分层级清洗,得到待挖掘的目标数据,其中,所述分层级清洗包括分行、去头去尾、全角转半角、繁体转简体。

可选的,在本发明第一方面的第二种实现方式中,所述采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息包括:

执行预置第一正则表达式,以提取所述目标数据中运单主体对应的第一关键信息,其中,所述第一关键信息包括:快递公司名称、运单号、运费、计费方式、时间信息、地址信息、备注信息;

执行预置第二正则表达式,以提取所述目标数据中商品主体对应的第二关键信息,其中,所述第二关键信息包括:商品名称、商品品牌、商品数量、商品规格、商品售价、商品属性;

执行预置第三正则表达式,以提取所述目标数据中电商平台主体对应的第三关键信息,其中,所述第三关键信息包括:电商平台名称、商品存储方式、商品运输方式;

执行预置第四正则表达式,以提取所述目标数据中商家主体对应的第四关键信息,其中,所述第四关键信息包括:商家名称、商家地址、商家联系方式;

执行预置第五正则表达式,以提取所述目标数据中消费者主体对应的第五关键信息,其中,所述第五关键信息包括:姓名、地址信息、联系方式、付款方式、支付渠道。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海东普信息科技有限公司,未经上海东普信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110206391.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top