[发明专利]快递数据挖掘方法、装置、设备及存储介质在审
申请号: | 202110206391.2 | 申请日: | 2021-02-24 |
公开(公告)号: | CN112905665A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 陈玉芬;李培吉;李斯;夏扬 | 申请(专利权)人: | 上海东普信息科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/215;G06F40/295;G06F16/31;G06F16/35;G06F40/216;G06Q10/08 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 201700 上海市青浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 快递 数据 挖掘 方法 装置 设备 存储 介质 | ||
本发明涉及数据挖掘领域,公开了一种快递数据挖掘方法、装置、设备及存储介质。所述方法包括:获取原始快递数据,所述原始快递数据包括运单主体数据、商品主体数据、电商平台主体数据、商家主体数据和消费者主体数据;对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据;采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息;分别对所述目标数据中不同主体的关键信息进行相关性分析,得到所述目标数据中不同主体的关键信息之间的关联关系;根据所述关键信息和所述关联关系,更新各主体对应的主体画像。本发明能够完善快递行业各主体画像的数据,使各环节的服务质量得到提高。
技术领域
本发明涉及数据挖掘领域,尤其涉及一种快递数据挖掘方法、装置、设备及存储介质。
背景技术
快递行业作为电商经济的重要一环,连接着商品、卖家、平台、消费者和仓库等多个主体,每个主体都承载着大量的数据,并且跟随着货物的运输而流动。在大数据时代,信息即是价值,对于这些数据的有效利用成为了行业内新的机遇。
现今快递行业各环节主体的数据相互孤立,数据挖掘工作往往是由各主体独立进行,在数据量不足且互不关联的情况下,各主体都难以使数据的价值最大化,而快递环节作为各主体的连接者,如何充分挖掘出商品、卖家、平台、消费者、仓库等主体之间的关联关系,打通快递行业中各环节的数据孤岛,成为了亟需解决的技术问题。
发明内容
本发明的主要目的在于解决现有快递行业数据利用率较低而难以提升行业价值的技术问题。
本发明第一方面提供了一种快递数据挖掘方法,包括:
获取原始快递数据,所述原始快递数据包括运单主体数据、商品主体数据、电商平台主体数据、商家主体数据和消费者主体数据;
对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据;
采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息;
分别对所述目标数据中不同主体的关键信息进行相关性分析,得到所述目标数据中不同主体的关键信息之间的关联关系;
根据所述关键信息和所述关联关系,更新各主体对应的主体画像。
可选的,在本发明第一方面的第一种实现方式中,所述对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据包括:
依次执行多个预置脱敏脚本,以对所述原始快递数据中的敏感信息进行脱敏处理;
对脱敏后的数据进行分层级清洗,得到待挖掘的目标数据,其中,所述分层级清洗包括分行、去头去尾、全角转半角、繁体转简体。
可选的,在本发明第一方面的第二种实现方式中,所述采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息包括:
执行预置第一正则表达式,以提取所述目标数据中运单主体对应的第一关键信息,其中,所述第一关键信息包括:快递公司名称、运单号、运费、计费方式、时间信息、地址信息、备注信息;
执行预置第二正则表达式,以提取所述目标数据中商品主体对应的第二关键信息,其中,所述第二关键信息包括:商品名称、商品品牌、商品数量、商品规格、商品售价、商品属性;
执行预置第三正则表达式,以提取所述目标数据中电商平台主体对应的第三关键信息,其中,所述第三关键信息包括:电商平台名称、商品存储方式、商品运输方式;
执行预置第四正则表达式,以提取所述目标数据中商家主体对应的第四关键信息,其中,所述第四关键信息包括:商家名称、商家地址、商家联系方式;
执行预置第五正则表达式,以提取所述目标数据中消费者主体对应的第五关键信息,其中,所述第五关键信息包括:姓名、地址信息、联系方式、付款方式、支付渠道。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海东普信息科技有限公司,未经上海东普信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110206391.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加工汽车零部件的挂钩
- 下一篇:一种土壤检测用旋转摇匀装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置