[发明专利]基于BDCH-DBSCAN的出租车载客热点识别方法有效
| 申请号: | 201810130946.8 | 申请日: | 2018-02-08 |
| 公开(公告)号: | CN108415975B | 公开(公告)日: | 2021-07-27 |
| 发明(设计)人: | 高尚兵;黄子赫;李木子;陈超;李胜东;周君;严云洋;陈晓兵;潘登峰;龚野 | 申请(专利权)人: | 淮阴工学院 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/28 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 吕朦 |
| 地址: | 223005 江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 bdch dbscan 出租车 载客 热点 识别 方法 | ||
1.一种基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,包括以下步骤:
(1)提供大量出租车GPS数据轨迹,从中剔除干扰数据,每个GPS数据轨迹包括多个GPS数据点,每个GPS数据点包括载客状态、经度、纬度;
(2)提取GPS数据轨迹中的上车数据点和下车数据点,若在该点之前的GPS数据点的载客状态为空载状态,在该点之后的GPS数据点的载客状态为载客状态,则判断该点为上车数据点;若在该点之前的GPS数据点的载客状态为载客状态,在该点之后的GPS数据点的载客状态为空载状态,则判断该点为下车数据点;
(3)对提取的上车数据点和下车数据点进行分块循环聚类,将数据以5000个为一组放入线程池中进行聚类,聚类设定扫描半径Eps和最小簇点数MinPts,采用DBSCAN算法分离出核心点,并获取核心点的邻居节点集,所述邻居节点集是以核心点为中心在半径Eps范围内的所有点的集合,邻居节点集中的点为邻居节点,对核心点进行扩展簇操作,扩展簇指对核心点的邻居节点进行类簇划分,类簇划分指将每个点分配到对应点集内,由此形成一个个簇,并将大于MinPts的邻居节点及其领域添加进簇中;
(4)找出簇心:根据上车数据点和下车数据点的经度、纬度,确定两个数据点之间的曲面距离用来发现扫描半径Eps内的邻居节点;对每一个簇内点P进行密度计算,点P的邻居节点个数占簇内总点数的比例记为P点密度;最后找出该簇中密度最大即所含邻居节点数最多的点作为该簇的簇心;
(5)将簇心集合重新写入轨迹点队列中再次聚类,并设定载客热点数量范围,直到最终簇心集合数量即载客热点数量达到设定的范围。
2.根据权利要求1所述的基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,步骤(1)中剔除干扰数据的方法为:设定出租车最大行驶速度为Vmax;在GPS数据轨迹中提取一段时间内的GPS数据点,记为GPS轨迹序列T{p1,p2,...,pk},选择保留满足下式的GPS轨迹序列:
式中:distance(pi+1,pi)表示pi+1到pi的欧式距离;pi,t表示采集pi轨迹点的时间,(pi+1,t-pi,t)表示pi+1点到pi点之间的时间差;
若pi不满足上式,则pi为跳变点,剔除该GPS数据轨迹。
3.根据权利要求1或2所述的基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,步骤(4)找出簇心的方法为:在获取类簇操作时,记录每一簇内节点的邻居点集中点的个数;对每一簇内的点进行密度计算,所述密度为该点的邻居点个数占簇内总点数的比例;找出簇中密度最大即所含邻居节点数最多的点,作为该簇的簇心。
4.根据权利要求1或2所述的基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,步骤(4)中确定两个数据点之间的曲面距离的方法为:
设两个数据点之间的曲面距离为L,则:
a=lat1-lat2
b=lon1-lon2
式中,lat1表示第一个数据点的纬度,lat2表示第二个数据点的纬度,lon1表示第一个轨迹点的经度,lon2表示第二个轨迹点的经度,R表示地球半径。
5.根据权利要求1或2所述的基于BDCH-DBSCAN的出租车载客热点识别方法,其特征在于,步骤(1)中的GPS数据点还包括簇序号、簇热点中心标识参数;所述簇序号为类簇编号,是每一类簇唯一的标识,用于区分各个类簇;所述簇热点中心标识参数为标记计算出的类簇中心点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810130946.8/1.html,转载请声明来源钻瓜专利网。





