[发明专利]基于BDCH-DBSCAN的出租车载客热点识别方法有效

专利信息
申请号: 201810130946.8 申请日: 2018-02-08
公开(公告)号: CN108415975B 公开(公告)日: 2021-07-27
发明(设计)人: 高尚兵;黄子赫;李木子;陈超;李胜东;周君;严云洋;陈晓兵;潘登峰;龚野 申请(专利权)人: 淮阴工学院
主分类号: G06F16/29 分类号: G06F16/29;G06F16/28
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 吕朦
地址: 223005 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 bdch dbscan 出租车 载客 热点 识别 方法
【说明书】:

发明公开了一种基于BDCH‑DBSCAN的出租车载客热点识别方法,首先提供大量出租车GPS数据轨迹,从中剔除干扰数据;提取GPS数据轨迹中的上车数据点和下车数据点;对提取的数据点进行多线程分块聚类,并采用DBSCAN算法分离出核心点,并获取核心点的邻居节点集,对核心点进行扩展簇操作,扩展簇指对核心点的邻居点进行类簇划分,并将大于最小簇点数的邻居核心点及其领域添加进簇中;根据两点之间的曲面距离找出扫描半径内的邻居节点,找出每个簇中的最大密度点,作为簇心,并对簇心集合再次循环聚类直至集合数量、精度满足要求。本发明可以适应大规模数据、便于识别类簇中心、多线程聚类速度快、精确度高。

技术领域

本发明涉及交通大数据领域,尤其涉及一种基于BDCH-DBSCAN的出租车载客热点识别方法。

背景技术

现今GPS轨迹数据作为交通大数据的一种,已被广泛应用。大量出租车上下客点形成的上下客热点对分析居民出行的时空分布、城市交通规划有着重要意义。

现有技术中,基于出租车载客热点的提取主要包括两种方式:(1)通过划分网格单元格的方式:如基于路网约束的DBSCAN改进算法,基于网格的K-Means交通热区识别算法,利用数据场势值阈值法探测轨迹点的聚集模式,提取热点区域。(2)基于无监督的聚类方式:如结合当前环境轨迹特征的DBSCAN算法,基于MapReduce的从出租车轨迹提取热点区域的分布并行算法,GBADBSCAN上下客热点生成聚类算法。这些算法在聚类热点区域中,均取得了较好的检测效果,但是在大数据处理精确度上仍存在不足。

DBSCAN是最常用的一种基于密度的聚类方法。传统的DBSCAN算法在聚类海量出租车行车轨迹数据点具有无法适应大规模数据、无法识别类簇中心、过程式单线程聚类速度慢等局限性。DBSCAN算法的基本原理是通过设定扫描半径Eps和最小包含点数MinPts来找出数据点集合中密度相连的最大集合。在半径Eps内含有超过MinPts数目的点叫做核心点;在半径Eps内含有小于MinPts数目,并且是在核心点的邻域内的点叫做边界点;既不是核心点也不是边界点的点叫做噪音点。但是,该方法只是简单的考虑了数据点之间的距离和每个核心点所需要的最小包含点数,在数据量大的情况下,经常会出现簇中轨迹点过多、覆盖面积较广、可视化效果差、热点无法被精确找到等问题。

发明内容

发明目的:为了解决现有技术存在的问题,既适用于大规模数据又能高效准确的找出类簇簇心,本发明提供一种基于BDCH-DBSCAN的出租车载客热点识别方法。

技术方案:一种基于BDCH-DBSCAN的出租车载客热点识别方法,包括以下步骤:

(1)提供大量出租车GPS数据轨迹,从中剔除干扰数据,每个GPS数据轨迹包括多个GPS数据点,每个GPS数据点包括载客状态、经度、纬度;

(2)提取GPS数据轨迹中的上车数据点和下车数据点,若在该点之前的GPS数据点的载客状态为空载状态,在该点之后的GPS数据点的载客状态为载客状态,则判断该点为上车数据点;若在该点之前的GPS数据点的载客状态为载客状态,在该点之后的GPS数据点的载客状态为空载状态,则判断该点为下车数据点;

(3)对提取的上车数据点和下车数据点聚类进行分块循环聚类,将数据以5000个为一组放入线程池中进行聚类,聚类设定扫描半径Eps和最小簇点数MinPts,采用DBSCAN算法分离出核心点,并获取核心点的邻居节点集,所述邻居节点集是以核心点为中心在半径Eps范围内的所有点的集合,邻居节点集中的点为邻居节点,对核心点进行扩展簇操作,扩展簇指对核心点的邻居节点进行类簇划分,类簇划分指将每个点分配到对应点集内,由此形成一个个簇,并将大于MinPts的邻居节点及其领域添加进簇中;

(4)找出簇心:根据上车数据点和下车数据点的经度、纬度,确定两个数据点之间的曲面距离用来发现扫描半径Eps内的邻居节点;对每一个簇内点P进行密度计算,点P的邻居节点个数占簇内总点数的比例记为P点密度;最后找出该簇中密度最大即所含邻居节点数最多的点作为该簇的簇心;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810130946.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top