[发明专利]一种基于深度学习的智能物流地址实体识别系统在审

专利信息
申请号: 202111523965.5 申请日: 2021-12-14
公开(公告)号: CN114328886A 公开(公告)日: 2022-04-12
发明(设计)人: 林嘉华;倪嘉辉;姜东晓 申请(专利权)人: 上海捷晓信息技术有限公司
主分类号: G06F16/335 分类号: G06F16/335;G06F16/35;G06F40/126;G06F40/205;G06F40/295;G06N3/08
代理公司: 上海智力专利商标事务所(普通合伙) 31105 代理人: 周涛
地址: 201700 上海市青浦区华*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 智能 物流 地址 实体 识别 系统
【说明书】:

本发明公开一种基于深度学习的智能物流地址实体识别系统,其特征在于,该系统组成包括有地址实体数据标注模块、BERT编码器模块和结果解析模块,地址实体数据标注模块接收地址结构化数据,获得高质量的已标注地址实体数据;BERT编码器模块进行深度学习算法学习物流业务实际应用场景的特定句子的编码表示,训练完成获得地址实体识别模型;结构解析模块基于训练完成的地址实体识别模块,在输入物流地址后输出由所输入地址提取的实体内容;还涉及到地址实体的识别提取方法。本发明解决了人工标注数据缓慢的问题,可以准确识别出的实体为一个网点下的主要实体,从而保证地址实体提取的准确性。

技术领域

本发明涉及物流技术领域,特别是一种基于深度学习的智能物流地址实体提取识别系统及物流地址实体的提取识别方法。

背景技术

当前智能化越来越成为时代的关键词互联网、物联网、大数据、人工智能等技术不断发展给多个行业带来创新的推动力,所谓智能物流是指通过先进的物流网技术实现物资运输过程的自动化运作和高效化管理.物流行业的智能化对于中国物流行业提高利润、降低物流成本具有积极的推动作用。

而作为智能物流的核心组成部分,“三段码”由三段编码构成:一段码(转运中心)+二段码(独立网点)+三段码(派件员)+四段码(末端实体)。一二三段码是通过对转运中心、独立网点和派件员进行编码。上述四段码则是根据地址数据对每个网点下派送的末端实体进行识别提取,从而提升物流的分拣效率,节约人员成本。在现有技术中,尚没有对四段码进行应用和提取的案例,即使有也是人工实现,存在着识别困难和识别准确率过低的问题。本发明拟就末端实体的应用和提取进行探索,以促进物流业的快速发展。

发明内容

本申请将利用深度学习技术解决目前智能物流领域物流地址实体识别困难、识别准确率过低的问题。提供一种基于深度学习的智能物流地址实体提取识别系统及物流地址实体的提取识别方法。

为了达到上述发明目的,本发明专利提供的技术方案如下:

一种基于深度学习的智能物流地址实体识别系统,该系统组成包括有地址实体数据标注模块、BERT编码器模块和结果解析模块,其中,

所述地址实体数据标注模块接收地址结构化数据,并对接收的地址结构化数据进行数据清洗,获得高质量的已标注地址实体数据;

所述的BERT编码器模块基于已标注地址实体数据,进行深度学习算法学习物流业务实际应用场景的特定句子的编码表示,训练完成获得地址实体识别模型;

所述的结构解析模块基于训练完成的地址实体识别模块,在输入物流地址时,对输入地址信息数据进行解析,解析完成后输出由所输入地址提取的实体内容。

在本发明的一种基于深度学习的智能物流实体识别系统中,在所述的BERT编码器模块中设有BERT编码器、全连接层、softmax分类器和分类优化器,所述BERT编码器处理输入的地址实体数据得到数据的向量表示,全连接层对数据向量表示增加权重,softmax分类器得到预测结果,分类优化器逐层调整模型权重实现模型迭代优化。

本发明还提供一种基于深度学习的智能物流地址实体的识别提取方法,该识别提取方法包括如下步骤:

第一步,数据预处理,将历史运单数据筛选,删除重复数据,获得干净的地址实体集;

第二步,地址实体集清洗,并对清洗后数据进行标注提取,经筛选过滤后提取有意义的实体数据,获得模型训练所用的数据;

第三步,BERT编码及模型训练,由BERT编码得到地址数据的向量表示,经模型训练和优化得到物流地址实体识别模型;

第四步,输入地址及结果解析,将物流地址输入至训练得到的物流地址实体识别模型,经过解析输出获得物流地址中的实体内容。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海捷晓信息技术有限公司,未经上海捷晓信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111523965.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top