[发明专利]地址信息标准化方法及装置、电子设备、存储介质在审
| 申请号: | 202011396932.4 | 申请日: | 2020-12-03 |
| 公开(公告)号: | CN112632213A | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 宋云华 | 申请(专利权)人: | 大箴(杭州)科技有限公司 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F40/289 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 地址 信息 标准化 方法 装置 电子设备 存储 介质 | ||
本发明涉及计算机领域,揭露了一种地址信息标准化方法及装置、电子设备、存储介质,包括:通过字典树模型对目标地址文本进行分词,得到多个子地址信息,其中,所述字典树模型是根据预设行政区划信息和预设地图导航兴趣点构建的;基于实际地址映射表对所述多个子地址信息进行标准化,得到标准地址信息。通过本发明,解决了相关技术中地址信息处理不准确且效率低的技术问题。
技术领域
本发明涉及计算机领域,具体而言,涉及一种地址信息标准化方法及装置、电子设备、存储介质。
背景技术
相关技术中,在邮政、生活缴费等领域存在着大量的地址相关信息,由于行政区划时不时存在变更,行政等级划分多样性,或POI(Point of interesting,即兴趣点)地址变化频繁、地址写法多变等问题,造成计算机难以高效地将地址文本映射为国家行政区划规定的真实地址。另外,由于日益产生的大规模数据,对地址数据处理的实时性提出了更高的标准,而现有的地址数据处理效率较低。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
发明内容
本发明实施例提供了一种地址信息标准化方法及装置、电子设备、存储介质,以至少解决了相关技术中地址信息处理不准确且效率低的技术问题。
第一方面,提供了一种地址信息标准化方法,包括:通过字典树模型对目标地址文本进行分词,得到多个子地址信息,其中,所述字典树模型是根据预设行政区划信息和预设地图导航兴趣点构建的;基于实际地址映射表对所述多个子地址信息进行标准化,得到标准地址信息。
在一种可能的实现方式中,在通过字典树模型对所述目标地址文本进行分词之前,所述方法还包括:获取实际地址;基于所述预设行政区划信息和所述预设地图导航兴趣点确定所述实际地址的行政区域级别以及地址代码,其中,所述地址代码是由所述行政区划信息包含的行政区域代码和所述地图导航兴趣点包含的分类代码组成;基于所述实际地址的地址名称、行政区域级别以及地址代码构建所述字典树模型;以及,生成所述实际地址映射表,其中,所述实际地址映射表用于表征所述实际地址的地址名称与所述地址代码之间的对应关系。
在另一种可能的实现方式中,在通过字典树模型对所述目标地址文本进行分词之前,所述方法还包括:获取所述行政区划信息和所述地图导航兴趣点,其中,所述行政区划信息包括:行政区域名称,行政区域级别和行政区域代码;所述地图导航兴趣点至少包括:兴趣点的名称,兴趣点的分类代码;对所述行政区划信息和所述地图导航兴趣点进行数据清洗,以去除错误信息。
在另一种可能的实现方式中,通过字典树模型对所述目标地址文本进行分词,得到多个子地址信息,包括:根据所述预设行政区划信息和所述地图导航兴趣点将所述目标地址文本分成多个子地址文本;基于动态规划算法模型确定所述多个子地址文本对应的目标规划路径;基于所述目标规划路径和所述多个子地址文本从所述字典树模型的根节点进行搜索,得到所述多个子地址信息,其中,每个子地址信息至少包括:子地址的地址名称,子地址对应的行政区域代码或分类代码,子地址对应的行政区域级别。
在另一种可能的实现方式中,基于实际地址映射表对所述多个子地址信息进行标准化,得到标准地址信息,包括:根据所述预设行政区划信息中的行政区域代码将所述多个子地址信息中的行政区划信息和地图导航兴趣点进行分离;根据所述预设行政区划信息中的预设个行政区域级别对所述多个子地址信息中的行政区域信息进行地址补充,得到第一地址信息;和/或,将所述多个子地址信息中的地图导航兴趣点与所述实际地址映射表进行匹配,得到第二地址信息;输出所述第一地址信息和/或所述第二地址信息,得到所述标准地址信息。
在另一种可能的实现方式中,根据所述预设行政区划信息中的预设个行政区域级别对所述多个子地址信息中的行政区域信息进行地址补充,得到第一地址信息,包括:按照所述预设行政区划信息中的行政区域级别对所述行政区域信息进行排序;删除所述行政区域信息中的错误或重复的行政地址,得到第三地址信息;基于所述预设个行政区域级别完善所述第三地址信息,得到所述第一地址信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大箴(杭州)科技有限公司,未经大箴(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011396932.4/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





