[发明专利]一种快递地址纠错方法、装置、存储介质及电子设备有效

专利信息
申请号: 202110594744.0 申请日: 2021-05-28
公开(公告)号: CN113221558B 公开(公告)日: 2023-09-19
发明(设计)人: 王玲玲;史陆敏;普恒安;李丽 申请(专利权)人: 中邮信息科技(北京)有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06F40/216
代理公司: 北京品源专利代理有限公司 11332 代理人: 孟金喆
地址: 100037 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 快递 地址 纠错 方法 装置 存储 介质 电子设备
【说明书】:

本申请实施例公开了一种快递地址纠错方法、装置、存储介质及电子设备。该方法包括:获取快递地址信息;其中,快递地址信息由位置归属地址和位置具体地址构成;利用分词技术对快递地址信息进行分词处理,获得关键词词序列和子地址词序列;根据预先确定的字典模型和Bert模型对关键词词序列进行纠错处理,获得目标关键词词序列;将目标关键词词序列和子地址词序列作为输入,基于Bert模型进行预测,得到目标快递地址信息。本技术方案,可以利用字典模型和Bert模型对关键词词序列和子地址词序列进行纠错处理,地址匹配计算简单,占用设备内存较小。且能够学习更远词序列位置信息,提高了纠错结果的准确率。

技术领域

本申请实施例涉及快递领域,尤其涉及一种快递地址纠错方法、装置、存储介质及电子设备。

背景技术

在快递领域,企业的业务活动中存在多种涉及地址数据的场景。例如:用户寄件时会选择和手动填写收寄件地址或者使用智能文字识别技术识别快递面单等地址数据,会产生识别错误。此外,中国的地名非常丰富,尤其是省(直辖市市)、市(区)、县(区)以下的行政区划,重名和名称相似的现象非常普遍。错误的地址数据,会大大降低后续的数据使用价值,甚至影响快递员的投递工作。因此,需要利用纠错技术纠正地址数据中可能存在的错误。

现有的地址纠错技术主要包括基于地址字典的方法和基于统计的N-Gram语言模型纠错方法。

基于地址字典的方法,在地址匹配的计算过程中,会占用过大的设备内存;单一基于统计的N-Gram语言模型纠错方法,无法学习较长的地址名称序列,预测准确率不够。

发明内容

本申请实施例提供一种快递地址纠错方法、装置、存储介质及电子设备,利用字典模型和Bert模型对关键词词序列和子地址词序列进行纠错处理,地址匹配计算简单,占用设备内存较小。且能够学习更远词序列位置信息,提高了纠错结果的准确率。

第一方面,本申请实施例提供了一种快递地址纠错方法,该方法包括:

获取快递地址信息;其中,所述快递地址信息由位置归属地址和位置具体地址构成;其中,所述位置归属地址中包括至少一个位置归属级别;

利用分词技术对所述快递地址信息进行分词处理,获得关键词词序列和子地址词序列;其中,所述关键词词序列由所述位置归属地址得到;所述子地址词序列由所述位置具体地址得到;

根据预先确定的字典模型和Bert模型对所述关键词词序列进行纠错处理,获得目标关键词词序列;其中,所述字典模型是根据地址数据以有根树结构进行建立的模型;所述Bert模型是根据地址库数据进行训练得到的模型;

将所述目标关键词词序列和子地址词序列作为输入,基于Bert模型进行预测,得到目标快递地址信息。

第二方面,本申请实施例提供了一种快递地址纠错装置,该装置包括:

快递地址信息获取模块,用于获取快递地址信息;其中,所述快递地址信息由位置归属地址和位置具体地址构成;其中,所述位置归属地址中包括至少一个位置归属级别;

分词处理模块,用于利用分词技术对所述快递地址信息进行分词处理,获得关键词词序列和子地址词序列;其中,所述关键词词序列由所述位置归属地址得到;所述子地址词序列由所述位置具体地址得到;

目标关键词词序列获得模块,用于根据预先确定的字典模型和Bert模型对所述关键词词序列进行纠错处理,获得目标关键词词序列;其中,所述字典模型是根据地址数据以有根树结构进行建立的模型;所述Bert模型是根据地址库数据进行训练得到的模型;

目标快递地址信息得到模块,用于将所述目标关键词词序列和子地址词序列作为输入,基于Bert模型进行预测,得到目标快递地址信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中邮信息科技(北京)有限公司,未经中邮信息科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110594744.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top