[发明专利]兴趣点数据关联方法及装置有效
申请号: | 200910089541.5 | 申请日: | 2009-07-23 |
公开(公告)号: | CN101963961A | 公开(公告)日: | 2011-02-02 |
发明(设计)人: | 王涛;杨东见 | 申请(专利权)人: | 高德软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣 数据 关联 方法 装置 | ||
技术领域
本发明涉及信息处理技术领域,尤其涉及一种兴趣点数据关联方法及装置。
背景技术
目前,在地理信息系统(Geographic Information System,GIS)中,兴趣点(Point Of Interest,POI)数据的采集方式主要有实地采集,互联网采集等。由于采集POI数据时,采集人员并不会考虑该POI数据是否已被采集过,因此,造成不同批次采集的POI数据之间存在很多重复的POI数据。
在对现有技术的研究和实践过程中,发明人发现由于重复POI数据的存在,使POI数据的应用出现了一些问题。比如,在某网站提供的电子地图服务中以“东来顺”为关键词查找与之相关的POI数据,该网站电子地图显示的POI数据查询结果中,西单有两个距离很近的“东来顺西单店”和“东来顺饭庄”,虽然这两个POI数据的名称不完全相同,但它们的地址都是“西单灵镜胡同23号”,这两个POI数据属于重复数据,这样的查询结果很容易使用户产生误解。因此,发明人认为目前亟需提供一种能够将相同POI数据关联在一起的技术,以便有效地解决POI数据重复的问题,使POI数据的应用更为完美。
发明内容
本发明实施例要解决的技术问题是提供一种能够将相同兴趣点数据关联在一起的兴趣点数据关联方法及装置。
为解决上述技术问题,本发明的目的是通过以下技术方案实现的:
本发明实施例提供了一种兴趣点数据关联方法,所述方法包括:
读取两个批次的兴趣点数据;
对所述兴趣点数据进行分组,得到两个批次兴趣点数据各自的分组集合及分组标识列表;
通过两个分组标识列表,从两个分组集合中各读取一个分组;
以一个分组兴趣点数据的属性为关键字建立哈希表;
用另一个分组兴趣点数据的属性与哈希表的关键字进行匹配,得到两个分组相同的兴趣点数据。
本发明实施例还提供了一种兴趣点数据关联装置,所述装置包括:
数据读取单元,用于读取两个批次的兴趣点数据;
分组单元,用于对所述兴趣点数据进行分组,得到两个批次兴趣点数据各自的分组集合及分组标识列表;
分组读取单元,用于通过两个分组标识列表,从两个分组集合中各读取一个分组;
哈希表创建单元,用于以一个分组兴趣点数据的属性为关键字建立哈希表;
第一关联单元,用于用另一个分组兴趣点数据的属性与哈希表的关键字进行匹配,得到两个分组相同的兴趣点数据。
上述技术方案具有如下有益效果:
本发明实施例提供的兴趣点数据关联方法,以一个分组POI数据的属性为关键字建立哈希表,通过用另一个分组POI数据的属性与哈希表的关键字进行匹配,得到两个分组相同的POI数据,有效地解决了POI数据重复的问题。
附图说明
图1为本发明实施例提供的兴趣点数据关联方法流程图;
图2为本发明实施例提供的兴趣点数据分组方法流程图;
图3为本发明实施例提供的分组读取方法流程图;
图4为本发明实施例提供的以名称为关键字进行POI数据关联的方法流程图;
图5为本发明实施例提供的以品牌代码为关键字进行POI数据关联的方法流程图;
图6为本发明实施例提供的以简称代码为关键字进行POI数据关联的方法流程图;
图7为本发明实施例提供的以主体名称为关键字进行POI数据关联的方法流程图;
图8为本发明实施例提供的通过名称相似度进行POI关联的方法流程图;
图9为本发明实施例提供的通过距离进行POI数据关联的方法流程图;
图10为本发明实施例提供的POI数据关联装置组成示意图。
具体实施方式
为使本发明实施例的目的、技术方案、及优点更加清楚明白,以下参照附图对本发明实施例提供的技术方案进行详细说明。
请参见图1,为本发明实施例提供的POI数据关联方法,该方法包括如下步骤:
步骤101:读取两个批次的POI数据;
在本发明实施例中,可以通过文件适配模块读取两个批次的POI数据。
采用文件适配模块读取POI数据好处在于:文件适配模块可以读取不同格式的数据文件(比如,*.CSV,*.XLS,*.DBF,*.DAT等),即不论POI数据存储在哪种格式的数据文件中,文件适配模块都可以读取,具体地:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高德软件有限公司,未经高德软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910089541.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:纸浆漂白方法
- 下一篇:用于对纤维网进行针刺的设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置