[发明专利]一种客户标准地址数据库的更新方法及系统在审
| 申请号: | 202211259838.3 | 申请日: | 2022-10-14 |
| 公开(公告)号: | CN115438061A | 公开(公告)日: | 2022-12-06 |
| 发明(设计)人: | 邰伟鹏;卞义;李伟;陈业斌 | 申请(专利权)人: | 安徽工业大学科技园有限公司 |
| 主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/29;G06F16/903 |
| 代理公司: | 南京九致知识产权代理事务所(普通合伙) 32307 | 代理人: | 严巧巧 |
| 地址: | 243000 安徽省马鞍山市经*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 客户 标准 地址 数据库 更新 方法 系统 | ||
1.一种客户标准地址数据库的更新方法,其特征在于,包括:
获取与原始地址对应的文本信息,并基于配置表对所述文本信息进行拆分以得到相应的区域地址数组及详情地址数组;其中,所述区域地址数组由高至低依次包括:省级地址、市级地址、县级地址、镇级地址及社区级地址;所述详情地址数组由高至低依次包括:楼栋地址及门牌地址;
拼接所述区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第一拼接地址,并基于第三方地址标准化API对所述第一拼接地址进行补充以得到第一补全地址,及与所述第一补全地址相应的经纬度数据;
基于Trie树结构将所述区域地址数组匹配至分词匹配表内,并取相应子节点中的关联地址对所述区域地址数组进行补充以得到补充区域地址数组;
拼接所述补充区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第二拼接地址,并基于第三方地址标准化API对所述第二拼接地址进行补充以得到第二补全地址,及与所述第二补全地址相应的经纬度数据;
通过分别计算所述第一补全地址、所述第二补全地址中各地址层级的权重和,并取与较大权重和对应的第一补全地址或第二补全地址作为预标准地址;其中,k为地址层级的总数,yi表示第i个地址层级是否为空值,yi=0表示为空值,yi=1表示有填充值,xi表示所述第一补全地址或所述第二补全地址中第i个地址层级与所述原始地址中第i个地址层级进行模糊匹配后的命中率,xj表示所述第一补全地址或所述第二补全地址中第j个地址层级与所述原始地址中第j个地址层级进行模糊匹配后的命中率,fij表示所述第一补全地址或所述第二补全地址中第j个地址层级命中后对第i个地址层级的影响系数;
基于所述详情地址数组对所述预标准地址进行补充以作为标准地址,并将所述标准地址及与之对应的经纬度数据存入标准地址数据库内以对其进行更新。
2.根据权利要求1所述的客户标准地址数据库的更新方法,其特征在于,所述基于配置表对所述文本信息进行拆分以得到相应的区域地址数组及详情地址数组之前,包括:
基于模糊语义算法对所述文本信息进行处理以修正其内的错误表述信息或缺陷表述信息。
3.根据权利要求1所述的客户标准地址数据库的更新方法,其特征在于,所述将所述标准地址及与之对应的经纬度数据存入标准地址数据库内之后,包括:
基于Trie树结构及多模式匹配算法对所述标准地址及所述分词匹配表间进行字符串匹配;
若匹配失败则基于所述标准地址在所述分词匹配表中构建新增地址节点。
4.根据权利要求1所述的客户标准地址数据库的更新方法,其特征在于,所述将所述标准地址及与之对应的经纬度数据存入标准地址数据库内之后,包括:
对比所述标准地址与所述标准数据库中的原有地址以补充所述原有地址中缺少的地址层级,或修改所述原有地址中有误的地址层级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽工业大学科技园有限公司,未经安徽工业大学科技园有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211259838.3/1.html,转载请声明来源钻瓜专利网。





