[发明专利]快递数据挖掘方法、装置、设备及存储介质在审

专利信息
申请号: 202110206391.2 申请日: 2021-02-24
公开(公告)号: CN112905665A 公开(公告)日: 2021-06-04
发明(设计)人: 陈玉芬;李培吉;李斯;夏扬 申请(专利权)人: 上海东普信息科技有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/215;G06F40/295;G06F16/31;G06F16/35;G06F40/216;G06Q10/08
代理公司: 北京市京大律师事务所 11321 代理人: 姚维
地址: 201700 上海市青浦区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 快递 数据 挖掘 方法 装置 设备 存储 介质
【权利要求书】:

1.一种快递数据挖掘方法,其特征在于,所述快递数据挖掘方法包括:

获取原始快递数据,所述原始快递数据包括运单主体数据、商品主体数据、电商平台主体数据、商家主体数据和消费者主体数据;

对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据;

采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息;

分别对所述目标数据中不同主体的关键信息进行相关性分析,得到所述目标数据中不同主体的关键信息之间的关联关系;

根据所述关键信息和所述关联关系,更新各主体对应的主体画像。

2.根据权利要求1所述的快递数据挖掘方法,其特征在于,所述对所述原始快递数据进行脱敏和清洗,得到待挖掘的目标数据包括:

依次执行多个预置脱敏脚本,以对所述原始快递数据中的敏感信息进行脱敏处理;

对脱敏后的数据进行分层级清洗,得到待挖掘的目标数据,其中,所述分层级清洗包括分行、去头去尾、全角转半角、繁体转简体。

3.根据权利要求1所述的快递数据挖掘方法,其特征在于,所述采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息包括:

执行预置第一正则表达式,以提取所述目标数据中运单主体对应的第一关键信息,其中,所述第一关键信息包括:快递公司名称、运单号、运费、计费方式、时间信息、地址信息、备注信息;

执行预置第二正则表达式,以提取所述目标数据中商品主体对应的第二关键信息,其中,所述第二关键信息包括:商品名称、商品品牌、商品数量、商品规格、商品售价、商品属性;

执行预置第三正则表达式,以提取所述目标数据中电商平台主体对应的第三关键信息,其中,所述第三关键信息包括:电商平台名称、商品存储方式、商品运输方式;

执行预置第四正则表达式,以提取所述目标数据中商家主体对应的第四关键信息,其中,所述第四关键信息包括:商家名称、商家地址、商家联系方式;

执行预置第五正则表达式,以提取所述目标数据中消费者主体对应的第五关键信息,其中,所述第五关键信息包括:姓名、地址信息、联系方式、付款方式、支付渠道。

4.根据权利要求1所述的快递数据挖掘方法,其特征在于,所述采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息包括:

分别对不同主体的所述目标数据进行分词处理,并将分词结果转化为嵌入词向量;

将所述各嵌入词向量输入预置实体词识别模型的LSTM层进行特征提取,得到特征序列;

将所述特征序列输入所述实体词识别模型的CRF层进行词性的转移概率计算,得到词性转移矩阵;

将所述词性转移矩阵输入所述实体词识别模型的SoftMax层进行归一化处理,输出所述目标数据中不同主体对应的关键信息,其中,所述关键信息为所述目标数据中不同主体对应的命名实体词。

5.根据权利要求1所述的快递数据挖掘方法,其特征在于,所述采用预置数据挖掘方法,分别提取所述目标数据中不同主体的关键信息包括:

根据结巴分词算法,对不同主体的所述目标数据进行分词处理,得到分词结果;

根据所述目标数据的语序顺序及上下文,对所述分词结果进行词性分类处理,得到分类结果;

根据所述分类结果,构建所述目标数据中各语句的有向依存关系图;

根据多生成树算法,解析所述有向依存关系图,得到所述目标数据中不同主体对应的依存关系树;

根据普里姆算法,搜索所述依存关系树中的最小生成树,得到所述目标数据中不同主体对应的关键信息,其中,所述关键信息为所述目标数据中不同主体对应的核心词和依存词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海东普信息科技有限公司,未经上海东普信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110206391.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top