[发明专利]一种针对行人行为模式的分布集中式交通大数据聚类方法在审
| 申请号: | 201310468804.X | 申请日: | 2013-10-10 |
| 公开(公告)号: | CN104572639A | 公开(公告)日: | 2015-04-29 |
| 发明(设计)人: | 马超;梁循;马跃峰;李晓菲;王媛媛 | 申请(专利权)人: | 中国人民大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
| 代理公司: | 无 | 代理人: | 无 |
| 地址: | 100872 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 针对 行人 行为 模式 分布 集中 交通 数据 方法 | ||
1.获取闯红灯行人的多个维度的信息,本发明分别选择2个(红灯时长、该路段实时平均车速)和4个维度(红灯时长、等待人数、马路宽度、该路段实时平均车速)作为影响行人闯红灯行为的因素,即一个闯红灯行人数据点的维度由选择的维度决定。
2.定义单个地区数据点的个数除以该地区每个维度上数据的最大值减去最小值的差相乘的积作为该地区数据的平均密度。
3.定义特征点表示的区域的测度(二维是圆的面积、三维是球的体积以此类推)乘以所能承受传输点的个数的最大值为该地区每个维度上数据的最大值减去最小值的差相乘的积,由此确定特征点表示区域的半径。
4.对于单个地点的数据,按照如下算法提取单个地点的特征点,包括特征点坐标、特征点权重、特征点表示范围的半径:
(1)在所有数据点中,随机选择一个没有被打上标记的点,将以这个点为圆心,R为半径的区域作为该点可以表示的区域,如果该区域的数据点密度大于平均密度的K倍(本发明取10),则将这个点作为一个特征点,其所表示区域内的点的个数作为该特征点的权重,并且将这个特征点所表示区域内的数据点全部打上标记,在下次搜索特征点的过程中将不再考虑这些点。如果搜索到的特征点的个数达到该地区所能承受的传输的点的最大值M,则停止搜索,传送所有特征点的坐标及权重;
(2)如果遍历所有未被打上标签的数据点仍然没有找到新的特征点,则将K(本发明取10)值减1,进入(1),直至K(本发明取10)值小于或等于1停止搜索,传送所有特征点的坐标及权重。
5.将多个地点的特征点坐标、特征点权重、特征点表示范围的半径以可承受的代价汇总到一处,对于汇总之后的数据,按照如下算法聚类:
随机选取一个没有被标记的特征点作为一棵树的根节点,按照广度优先的原则进行树的生成过程,其中树的每一个节点即为一个特征点,一棵树的所有节点属于一个聚簇,每一个新生成的子节点满足以下两个条件:
(a)子节点与父节点的距离不超过对应特征点所代表区域的半径的和(即相切);
(b)子节点所对应特征点的密度大于根节点对应特征点的密度;
每增加一个子节点都对其是否有标记做判断,如果没有标记,则将该节点对应的特征点归入当前聚簇并打上标记,如果已经有了标记,则将当前生成的树所对应的聚类与该新增加的节点所对应的聚簇合并为一个聚簇,并开始一个新的树的搜索过程;
直至:所有的特征点都被归为一个聚簇当中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学;,未经中国人民大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310468804.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:舆情数据存储方法和装置
- 下一篇:智能机器人交互系统在投融资领域的应用





