[发明专利]挖掘地址兴趣点关系的方法、装置、设备及存储介质有效
| 申请号: | 201811045423.X | 申请日: | 2018-09-07 |
| 公开(公告)号: | CN109376205B | 公开(公告)日: | 2022-03-29 |
| 发明(设计)人: | 柯俞嘉;杜堃;许颖聪;潘舒静;张英驰;金晶;陈秋丽 | 申请(专利权)人: | 顺丰科技有限公司 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/215 |
| 代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 郭栋梁 |
| 地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 挖掘 地址 兴趣 关系 方法 装置 设备 存储 介质 | ||
本申请公开了挖掘地址兴趣点关系的方法、装置、设备及存储介质。所述方法包括:获取预定区域内地址兴趣点;根据地址兴趣点所对应的地址信息将地址兴趣点进行网格化;基于所述网格化的结果,对任意两个不同的地址兴趣点进行相似度计算;基于所述相似度计算的结果对不同的地址兴趣点进行聚类分析,以获得任意两个地址兴趣点的关系。本申请技术方案实现了通过特定方式挖掘兴趣点数据,确定地址兴趣点关系。
技术领域
本发明涉及地址数据的处理方法,尤其涉及挖掘地址兴趣点关系的方法、装置、设备及存储介质。
背景技术
某一区域内的道路门牌、小区名称、大厦名称等是重点地理对象数据,称之为兴趣点(Point of Interest,POI)。将地址信息分层级划分、按相关性合理存储,是地址大数据库建立的关键环节。
在现有基于地址信息的业务中,由于数据来源渠道多样,致使数据库在处理信息过程中未将众多兴趣点进行有效的空间距离分类,离散的兴趣点难以应用于业务场景;兴趣点在数据库中被视作了独立的点,彼此之间的地理层级关系没有被很好的挖掘,造成资源的浪费。
当前,对地址兴趣点分类普遍采取获得地址经纬度,直接进行聚类分析。因为存在一定比例的经纬度不准确,导致聚类结果粒度太细、复用性低。
发明内容
鉴于上述问题,提出了本发明以便提供挖掘地址兴趣点关系的方法,用于对地址进行层级划分,提高复用性克服上述问题或者部分解决上述问题的地址兴趣点关系挖掘方法。
本发明提供的一种挖掘地址兴趣点关系的方法,包括以下步骤:
获取预定区域内的地址兴趣点;
据地址兴趣点所对应的地址信息将地址兴趣点进行网格化;
基于所述网格化的结果,对任意两个不同的地址兴趣点进行相似度计算;
基于所述相似度计算的结果对不同的地址兴趣点进行聚类分析,以获得任意两个地址兴趣点的关系。
本发明的另外一方面,提供了一种被配置以挖掘地址兴趣点关系的装置,其特征在于,包括以下单元:
地址兴趣点获取单元,被配置以获取预定区域内的地址兴趣点;
网格化单元,被配置以根据地址兴趣点所对应的地址信息将地址兴趣点进行网格化;
相似度计算单元,被配置以基于所述网格化的结果对两个不同的地址兴趣点进行相似度计算;
聚类分析单元,被配置以基于所述相似度计算的结果对所述两个不同的地址兴趣点进行聚类分析,以获得所述两个地址兴趣点的关系。
根据本发明的另外一方面,提供了一种挖掘地址兴趣点关系的设备,包括:
一个或者多个处理器;
存储器,用于存储一个或者多个程序;
当所述一个或者多个程序被所述一个或者多个处理器执行时,使得所述一个或者多个处理器执行所述实现如上任一所述的方法。
根据本发明的另外一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于实现如上任一项所述的方法。
本申请所提供的方案中,对各地址兴趣点相对于其余地址兴趣点的相似度结果进行聚类分析,根据预定范围获得筛选出关联性大的地址,规定其为一个类别。进一步,对该类地址兴趣点的对称相似度进行谱聚类确定关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811045423.X/2.html,转载请声明来源钻瓜专利网。





