[发明专利]基于K-means的妥投地址数据处理方法和系统有效
申请号: | 201610262654.0 | 申请日: | 2016-04-25 |
公开(公告)号: | CN107305577B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 胡焕叶 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06K9/62 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 张靖琳;蔡纯 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 means 地址 数据处理 方法 系统 | ||
本发明公开了一种基于K‑means的妥投地址数据处理方法和系统,其中,所述方法包括:获取给定地址的多个妥投地址的地理坐标,形成坐标点群;根据K‑means聚类算法,设定聚类个数为1,对所述坐标点群进行第一次聚合,获取第一次聚合坐标点P1(x1,y1);以所述第一次聚合坐标点P1(x1,y1)为圆心作圆,得到圆内坐标点的数量大于或等于预设的聚合数量阈值N1的最终圆;根据K‑means聚类算法,对最终圆内多个坐标点进行聚合,获取最终聚合坐标点Pf(xf,yf),并将所述最终聚合坐标点Pf(xf,yf)作为所述给定地址的地理坐标。本发明利用K‑means聚类算法,准确地确定给定地址的地理坐标,在保证结果准确度的前提下,提高了数据处理效率,并且为后期地图数据的细化提供了丰富而准确的数据。
技术领域
本发明涉及地理空间信息数据的处理技术领域,具体地说,涉及一种基于K-means的妥投地址数据处理方法和系统。
背景技术
随着空间信息技术和移动互联网的发展和应用,地理信息技术已广泛应用于互联网的各个领域,尤其是智能位置服务,其已成为互联网发展的关键支撑技术之一。
在电商的物流投递系统中,电商的快递员根据商品的运单地址,将物品投递给用户,并记录投递时的地理坐标,也就是妥投地址的地理坐标。在电商的系统中,通常在同一个地址下会有多个历史累积的订单,如同一用户有过多次购买行为,因而会下过多次订单。由于每一次订单的快递员可能不同,用户接收商品的地点可能不同,因而,针对同一个地址,妥投地址的地理坐标可能会不同,所以,这就产生了在同一个地址下,电商系统中对应有多个妥投地址的地理坐标的问题。这些妥投地址的地理坐标并不是智能位置服务需要的最终数据,而且,这些地理坐标总是会在一定范围变化,如果波动范围较大,则会影响正/逆向获取地址的准确性。即根据地址得到地理坐标,或根据地理坐标得到地址的准确性。
在大型电商的投递系统中,记录了大量的地址地理坐标数据,而这些数据正是目前大多数GIS(Geographic Information System,地理信息系统)系统所需要的数据源。多数的GIS系统通过地理坐标采集或购买来获得数据源。对于采集的地理坐标数据,数据单薄,而且数据准确度受信号、采集人员等多方面因素的影响,采集数据误差在所难免,且不易控制。
发明内容
本发明要解决的技术问题在于,针对目前同一地址对应多个妥投地址地理坐标的问题,提供了一种基于K-means的妥投地址数据处理方法和系统,用于通过所述多个妥投地址的地理坐标确定一个与所述地址对应的准确地理坐标。
为解决上述技术问题,根据本发明的一个方面,本发明提供了一种基于K-means的妥投地址数据处理方法,其中,包括如下步骤:
获取给定地址的多个妥投地址的地理坐标,并将所述多个妥投地址的地理坐标作为源数据,形成坐标点群;
根据K-means聚类算法,以聚类个数值为1,对所述坐标点群进行第一次聚合,获取第一次聚合坐标点P1(x1,y1);
以所述第一次聚合坐标点P1(x1,y1)为圆心作圆,得到圆内坐标点的数量大于或等于预设的聚合数量阈值N1的最终圆;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610262654.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:页面的伪静态处理方法和装置
- 下一篇:人机智能问答方法和装置