[发明专利]一种地址匹配方法在审
申请号: | 201510230110.1 | 申请日: | 2015-05-08 |
公开(公告)号: | CN105005577A | 公开(公告)日: | 2015-10-28 |
发明(设计)人: | 沈启明;密铁宾 | 申请(专利权)人: | 裴克铭管理咨询(上海)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200125 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种地址匹配方法,其采取分层渐进式的匹配方法,具体包括快速匹配、经纬度匹配、模糊匹配和人工判定四个步骤,快速匹配对高质量目标地址进行精确匹配,运用链式补充机制适当补充匹配;经纬度匹配依据地图服务提供商提供的经纬度信息对目标地址和其邻近小区进行匹配;模糊匹配运用模糊索引对目标地址和相似小区进行匹配;人工判定机制对匹配的结果进行检验和把关。本发明其还包括地址分词技术和地址匹配准确性的信心指数机制。本发明在保证高匹配成功率的条件下提高匹配效率,其解决了多重地址匹配技术复合运用问题,很大程度提高了地址匹配的成功率以及容错性,同时运用一系列优化机制保证了程序运行的效率。 | ||
搜索关键词: | 一种 地址 匹配 方法 | ||
【主权项】:
一种地址匹配方法,其特征在于:所述地址匹配方法采取分层渐进式的匹配方法,具体包括快速匹配、经纬度匹配、模糊匹配和人工判定四个步骤:a、快速匹配:将预验信心指数符合标准的待匹配地址信息,导入快速匹配通道,对各个地址要素进行精确匹配,运用链式补充机制适当补充匹配;如果除缺失项外其余要素均成功匹配,则整条地址判为成功匹配,记录并计算后验信心指数,有任意项不符,则判为匹配失败;匹配失败的地址信息以及刚开始不符合预验信心指数标准的地址信息送入经纬度匹配进行处理;b、经纬度匹配:将待匹配地址信息发送到地图服务提供商的开放API获取地址数据所对应的经纬度,依据经纬度索引调取该经纬度所属区块及其邻近区块;导入这些区块中所有POI经纬度数据来测量与目标地址的距离,用合理距离内的POI地址与目标地址进行精确匹配,如果匹配成功则记录并计算后验信心指数;如果匹配失败,用模糊匹配再次尝试,成功则记录,依然失败则送入最终模糊匹配阶段进行处理;c、模糊匹配:所述模糊匹配根据中文同音字多,形似字发音也多类似的特点根据中文拼音建立模糊规则,将中文字符串转换成拼音字符串的方式进行模糊处理,并运用该匹配方法建立模糊索引,具体方式为:先为不同地址要素制定对应的索引编码规则,提取每个地址要素的中文字的拼音首字母,按该要素所对应的索引编码规则与数字进行结合构成模糊索引;在地址匹配过程中,将待匹配地址中经过分词算法切分出的地址要素依照模糊规则转换成拼音首字母组合,再提取数据库中该地址要素所对应的符合该首字母组合的分类,对该分类中所有条目进行比对。d、人工判定:根据信心指数选取低于某个标准的地址信息,人工做出匹配判定,或者对信心指数较高的地址进行抽样检查,为匹配流程提供灵活性和验证机制。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于裴克铭管理咨询(上海)有限公司,未经裴克铭管理咨询(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510230110.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种训练数据的处理方法及装置
- 下一篇:一种视频网站相似用户搜索系统和方法