[发明专利]一种基于图结构的地名地址的解析方法有效
申请号: | 202010271555.5 | 申请日: | 2020-04-09 |
公开(公告)号: | CN111191084B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 冯建亮;周雄;徐忠建;朱必亮 | 申请(专利权)人: | 速度时空信息科技股份有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/904;G06F16/29;G06F40/289;G06F40/295 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 210042 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 地名 地址 解析 方法 | ||
本发明公开了一种基于图结构的地名地址的解析方法,具体包括以下步骤:S1定义地名地址图模型,用以表达地名地址的路径图;S2基于涉及地名地址的基础地理信息数据以及专题地理信息数据,构建地名地址路径图数据库、地名地址空间数据库和地名地址全文索引数据库地名地址全文索引数据库,分别用于表达地名地址空间数据、地名地址路径图和地名地址全文索引,并将所述地名地址空间数据数据库和地名地址路径图数据库合并;S3基于地名地址图结构的解析方法,首先进行分词及命名实体识别,再通过全文索引获取候选路径,然后在地名地址图数据库中进行路径匹配;从而实现快速准确地解析地名地址,且具有更好的解析广度。
技术领域
本发明涉及地名地址空间数据库的构建与检索技术领域,具体涉及一种基于图结构的地名地址的解析方法。
背景技术
地名地址的检索包括两种类型:正向解析,根据地名地址的名称查询地名地址的空间位置等各类属性;逆向解析,即根据空间位置查询地名地址名称等各类属性;正向解析主要通过地址编码(Geocoding),由于中文地名地址的特性,针对中文地名地址的正向解析主要包括分词与解析两步,分词多依赖自然语言处理的规则方法或机器学习方法,而解析多侧重于标准地址或兴趣点(POI)。随着智慧城市建设过程中地名地址标准化采集整合更新机制的逐步完善,需要对地名地址描述的丰富语义进行表达,而图数据库、全文索引技术的成熟,使基于图结构的地名地址解析成为可能。
因此,有必要开发一种基于图结构的地名地址的解析方法,通过定义地名地址图模型,构建地名地址图数据库,设计地名地址路径匹配方法,实现快速准确的解析地名地址。
发明内容
本发明要解决的技术问题是提供一种基于图结构的地名地址的解析方法,通过定义地名地址图模型,构建地名地址图数据库,设计地名地址路径匹配方法,实现对地名地址的解析,从而实现快速准确地解析地名地址,且具有更好的解析广度。
为了解决上述技术问题,本发明采用的技术方案是:该基于图结构的地名地址的解析方法,具体包括以下步骤:
S1定义地名地址图模型,用以表达地名地址的路径图;
S2基于涉及地名地址的基础地理信息数据以及专题地理信息数据,构建地名地址路径图数据库、地名地址空间数据库和地名地址全文索引数据库,分别用于表达地名地址路径图、地名地址空间数据和地名地址全文索引,并将所述地名地址空间数据库和地名地址路径图数据库合并;
S3基于地名地址图结构的解析方法,首先进行分词及命名实体识别,再通过全文索引获取候选路径,然后在地名地址图数据库中进行路径匹配,实现对地名地址的解析。
作为本发明的优选技术方案,所述步骤S2具体包括以下步骤:S21构建地名地址路径图数据库:基于兼容步骤S1定义的所述地名地址图模型,根据基底地名地址构建所述地名地址路径图数据库,所述地名地址路径图数据库包括主干地名地址图结构和外部地名地址图结构;
S22构建地名地址空间数据数据库:根据基底地名地址的要素信息以及空间网络模型进行空间索引,将R树和网络拓扑索引树合并入所述地名地址路径图数据库;
S23构建地名地址全文索引内容数据库:构建地名地址文本的全文索引,针对地名地址的通名、专名、拼音、类型进行全文检索;
S24将合并后的地名地址路径图数据库和地名地址空间数据数据库与所述地名地址全文索引数据库的同一地名地址进行双向关联,当出现数据不一致时,以所述地名地址空间数据数据库作为数据一致性的基准;解析的遍历过程以所述地名地址路径图数据库及与其合并的所述地名地址空间数据数据库为核心。
作为本发明的优选技术方案,所述步骤S3基于地名地址图结构的解析方法包括分词及命名实体识别,全文检索获取候选路径,在所述地名地址图数据库中进行路径匹配;具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于速度时空信息科技股份有限公司,未经速度时空信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010271555.5/2.html,转载请声明来源钻瓜专利网。