[发明专利]快递数据挖掘方法、装置、设备及存储介质在审
申请号: | 202110206391.2 | 申请日: | 2021-02-24 |
公开(公告)号: | CN112905665A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 陈玉芬;李培吉;李斯;夏扬 | 申请(专利权)人: | 上海东普信息科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/215;G06F40/295;G06F16/31;G06F16/35;G06F40/216;G06Q10/08 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 201700 上海市青浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 快递 数据 挖掘 方法 装置 设备 存储 介质 | ||
1.一种快递数据挖掘方法,其特征在于,所述快递数据挖掘方法包括:
获取原始快递数据,所述原始快递数据包括运单主体数据、商品主体数据、电商平台主体数据、商家主体数据和消费者主体数据;
对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据;
采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息;
分别对所述目标数据中不同主体的关键信息进行相关性分析,得到所述目标数据中不同主体的关键信息之间的关联关系;
根据所述关键信息和所述关联关系,更新各主体对应的主体画像。
2.根据权利要求1所述的快递数据挖掘方法,其特征在于,所述对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据包括:
依次执行多个预置脱敏脚本,以对所述原始快递数据中的敏感信息进行脱敏处理;
对脱敏后的数据进行分层级清洗,得到待挖掘的目标数据,其中,所述分层级清洗包括分行、去头去尾、全角转半角、繁体转简体。
3.根据权利要求1所述的快递数据挖掘方法,其特征在于,所述采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息包括:
执行预置第一正则表达式,以提取所述目标数据中运单主体对应的第一关键信息,其中,所述第一关键信息包括:快递公司名称、运单号、运费、计费方式、时间信息、地址信息、备注信息;
执行预置第二正则表达式,以提取所述目标数据中商品主体对应的第二关键信息,其中,所述第二关键信息包括:商品名称、商品品牌、商品数量、商品规格、商品售价、商品属性;
执行预置第三正则表达式,以提取所述目标数据中电商平台主体对应的第三关键信息,其中,所述第三关键信息包括:电商平台名称、商品存储方式、商品运输方式;
执行预置第四正则表达式,以提取所述目标数据中商家主体对应的第四关键信息,其中,所述第四关键信息包括:商家名称、商家地址、商家联系方式;
执行预置第五正则表达式,以提取所述目标数据中消费者主体对应的第五关键信息,其中,所述第五关键信息包括:姓名、地址信息、联系方式、付款方式、支付渠道。
4.根据权利要求1所述的快递数据挖掘方法,其特征在于,所述采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息包括:
分别对不同主体的所述目标数据进行分词处理,并将分词结果转化为嵌入词向量;
将所述各嵌入词向量输入预置实体词识别模型的LSTM层进行特征提取,得到特征序列;
将所述特征序列输入所述实体词识别模型的CRF层进行词性的转移概率计算,得到词性转移矩阵;
将所述词性转移矩阵输入所述实体词识别模型的SoftMax层进行归一化处理,输出所述目标数据中不同主体对应的关键信息,其中,所述关键信息为所述目标数据中不同主体对应的命名实体词。
5.根据权利要求1所述的快递数据挖掘方法,其特征在于,所述采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息包括:
根据结巴分词算法,对不同主体的所述目标数据进行分词处理,得到分词结果;
根据所述目标数据的语序顺序及上下文,对所述分词结果进行词性分类处理,得到分类结果;
根据所述分类结果,构建所述目标数据中各语句的有向依存关系图;
根据多生成树算法,解析所述有向依存关系图,得到所述目标数据中不同主体对应的依存关系树;
根据普里姆算法,搜索所述依存关系树中的最小生成树,得到所述目标数据中不同主体对应的关键信息,其中,所述关键信息为所述目标数据中不同主体对应的核心词和依存词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海东普信息科技有限公司,未经上海东普信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110206391.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加工汽车零部件的挂钩
- 下一篇:一种土壤检测用旋转摇匀装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置