[发明专利]地址标准化方法、装置、计算机设备和存储介质在审
| 申请号: | 202011278707.0 | 申请日: | 2020-11-16 |
| 公开(公告)号: | CN112364114A | 公开(公告)日: | 2021-02-12 |
| 发明(设计)人: | 李超;徐国强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/9537;G06F40/289 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 陈小娜 |
| 地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 地址 标准化 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及大数据技术领域,特别涉及一种地址标准化方法、装置、计算机设备和存储介质。方法包括:获取待处理地址对应的层级关键词列表;基于层级关键词列表中的层级字段值对待处理地址进行切分处理得到切分字段;从层级关键词列表中查找与切分字段对应的区域层级,并将未能查找到区域层级的切分字段作为待处理切分字段;获取与待处理地址对应的地址配置库,从地址配置库中获取与待处理切分字段对应的区域层级;根据待处理地址对应的区域层级得到标准化的地址。其中,标准化的地址可以存储于区块链中,采用本方法能够提高地址标准化的效率。
技术领域
本申请涉及大数据技术领域,特别是涉及一种地址标准化方法、装置、计算机设备和存储介质。
背景技术
随着物流技术的发展,快递在我们生活中越来越普遍,在寄快递的过程中都需要填写地址。而在一些情况下,地址是由人工填写,存在地址填写不规范的问题。
在传统技术中是通过人工的方式对不规范的地址进行标准化处理,导致对地址的标准化处理效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高地址标准化处理效率的地址标准化方法、装置、计算机设备和存储介质。
一种地址的标准化方法,方法包括:
获取待处理地址对应的层级关键词列表;
基于层级关键词列表中的层级字段值对待处理地址进行切分处理得到切分字段;
从层级关键词列表中查找与切分字段对应的区域层级,并将未能查找到区域层级的切分字段作为待处理切分字段;
获取与待处理地址对应的地址配置库,从地址配置库中获取与待处理切分字段对应的区域层级;
根据待处理地址对应的区域层级得到标准化的地址。
在一个实施例中,获取待处理地址对应的层级关键词列表,包括:
获取历史地址数据,对历史地址数据中的区域层级进行标注得到层级标注值;
从历史地址数据中获取与层级标注值对应的层级字段值、层级字段值对应的层级关键词以及层级关键词的层级位置信息;
根据每一个区域层级对应的层级标注值、层级字段值、层级关键词以及层级关键词的层级位置信息,建立每一个区域层级对应的层级关键词列表,所述层级关键词列表存储于区块链中。
在一个实施例中,基于层级关键词列表中的层级字段值对待处理地址进行切分处理得到切分字段,包括:
将待处理地址中的地址字段与层级关键词列表中的层级字段值进行匹配,将匹配成功的层级字段值提取为切分字段值,将匹配成功的地址字段提取为待切分字段;
从层级关键词列表中获取与切分字段值对应的层级关键词,以及层级关键词对应的层级位置信息;
获取层级位置信息对应的层级位置替换符,根据层级位置替换符对待切分字段进行替换处理得到待替换地址;
根据待替换地址中的位置替换符对待替换地址进行切分处理,得到多个切分字段。
在一个实施例中,基于层级关键词列表中的层级字段值对待处理地址进行切分处理得到切分字段之后,方法还包括:
查找切分字段中对应的层级关键词的个数;
当层级关键词的个位为一个时,从层级关键词列表中查找与切分字段对应的区域层级;
当层级关键词的个数为多于一个时,继续对待处理字段进行切分处理,直至得到包括一个层级关键词的切分字段。
在一个实施例中,并将未能查找到区域层级的切分字段作为待处理切分字段之后,方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011278707.0/2.html,转载请声明来源钻瓜专利网。





