[发明专利]一种地名匹配方法及装置有效
申请号: | 201310034595.8 | 申请日: | 2013-01-29 |
公开(公告)号: | CN103106264A | 公开(公告)日: | 2013-05-15 |
发明(设计)人: | 程钢;卢小平;于海洋;文运平;杨杰 | 申请(专利权)人: | 河南理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 454150 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 地名 匹配 方法 装置 | ||
技术领域
本发明测绘科学与技术领域,尤其涉及一种地名匹配方法和装置。
背景技术
随着网络技术的迅速发展及人们对基于位置信息的服务的需求的快速增长,地名已经成为普通民众获取信息的重要地理参考。如何从海量的地理信息资源中快速检索出所需的信息,成为地名研究中的重要课题。
当前的地名匹配方法,将地名作为普通字符串,与地名库中的已有地名进行匹配,只将地名作为普通的字符串,而忽略了地名的符号和语义特征,因此不能提供较高的准确性。
发明内容
有鉴于此,本发明实施例提供了一种地名匹配方法及装置,目的在于解决现有的地名匹配方法存在的准确性不高的问题。
一种地名匹配方法,应用于中文地名,包括:
将第一地名及第二地名分别分解为专名和通名;
计算所述第一地名的专名与所述第二地名的专名的专名相似度;
计算所述第一地名的通名与所述第二地名的通名的通名相似度;
依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度。
优选地,所述将第一地名及第二地名分别分解为专名和通名包括:
去除第一地名中的非法字符后,将所述第一地名与预设的通名词库进行对比,确定所述第一地名中的通名;
从所述第一地名去除所述第一地名中的通名,得到所述第一地名中的专名;
去除第二地名中的非法字符后,将所述第二地名与所述预设的通名词库进行对比,确定所述第二地名中的通名;
从所述第二地名去除所述第二地名中的通名,得到所述第二地名中的专名。
优选地,所述计算所述第一地名的专名与所述第二地名的专名的专名相似度包括:
确定所述第一地名的专名与所述第二地名的专名间的中文编辑距离;
依据所述中文编辑距离及所述第一地名的专名的中文长度和所述第二地名的专名的中文长度中的较大者,计算所述第一地名的专名与所述第二地名的专名的相似度。
优选地,所述计算所述第一地名的通名与所述第二地名的通名的通名相似度包括:
确定所述第一地名的通名与所述第二地名的通名间的语义距离、概念深度、概念密度及关系类型;
依据所述语义距离、概念深度、概念密度及关系类型计算所述通名的语义相似度。
优选地,所述依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度包括:
依据预设的权重计算规则,确定所述专名相似度的第一权重,及所述通名相似度的第二权重;
依据所述第一权重、第二权重、所述第一地名的专名、所述第一地名的通名、所述第二地名的专名、所述第二地名的通名,计算所述第一地名与所述第二地名的相似度。
一种地名匹配装置,应用于中文地名,包括:
地名分解模块,用于将第一地名及第二地名分别分解为专名和通名;
专名相似度计算模块,用于计算所述第一地名的专名与第二地名的专名的专名相似度;
通名相似度计算模块,用于计算所述第一地名的通名与所述第二地名的通名的通名相似度;
地名相似度确定模块,用于依据所述专名相似度和所述通名相似度,确定所述第一地名与所述第二地名的相似度。
优选地,所述地名分解模块包括:
过滤模块,用于在将第一地名及第二地名分别分解为专名和通名之前,去除所述第一地名及第二地名中的非法字符;
通名确定单元,用于将所述第一地名及第二地名与预设的通名词库进行对比,确定所述第一地名及第二地名各自的通名;
专名确定单元,用于从所述第一地名中去除所述第一地名中的通名,得到所述第一地名中的专名,及从所述第二地名中去除所述第二地名中的通名,得到所述第二地名中的专名。
优选地,所述专名相似度计算模块包括:
编辑距离确定单元,用于确定所述第一地名的专名与所述第二地名的专名间的中文编辑距离;
专名的相似度计算单元,用于依据所述中文编辑距离及所述第一地名的专名的长度和所述第二地名的专名的长度中的较大者,计算所述第一地名的专名与所述第二地名的专名的相似度。
优选地,所述通名相似度计算模块包括:
参数确定单元,用于确定所述第一地名的通名与所述第二地名的通名间的语义距离、概念深度、概念密度及关系类型;
通名语义相似度计算单元,用于依据所述语义距离、概念深度、概念密度及关系类型计算所述通名的语义相似度。
优选地,所述地名相似度确定模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南理工大学,未经河南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310034595.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PLM系统中的文件处理方法
- 下一篇:一种便携式翻盖汉语教学收音装置