[发明专利]一种基于Spark的路网交通运行分析方法在审
申请号: | 201910129703.7 | 申请日: | 2019-02-21 |
公开(公告)号: | CN109903554A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 钱超;杨孟;朱熹;许宏科;刘冬伟 | 申请(专利权)人: | 长安大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 安彦彦 |
地址: | 710064 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 路网交通 算法 运行分析 运行状态 大数据 分布式文件系统 高速公路管理 运行状态分析 分布式数据 实时交通流 并行处理 管控平台 机器学习 交通数据 聚类分析 判别模型 算法构建 随机森林 运行态势 传统的 时效性 路网 存储 高速公路 服务 | ||
一种基于Spark的路网交通运行分析方法,以实时交通流数据为基础,结合k‑means和随机森林算法构建了路网交通运行态势判别模型;选择分布式文件系统存储和弹性分布式数据集并行处理交通数据,实现了路网交通运行状态的实时判别。本发明利用Spark大数据机器学习平台,结合分布式k‑means算法进行聚类分析,改善了传统的k‑means算法在大数据情况下,算法时效性的问题,实现路网交通运行状态的判别,分析结果可为高速公路管理部门提供实时、可靠的路网运行状态分析服务,同时可为建立高速公路智慧管控平台提供理论依据。
技术领域
本发明涉及智能交通领域,具体涉及应用大数据分析与挖掘技术建立的一种基于Spark的路网交通运行分析方法。
背景技术
随着智能交通系统(Intelligent Transportation System,ITS)研究的深入展开,道路交通数据规模和复杂度呈爆发式增长,呈现出大数据的“6V”特征。然而在高速公路领域,交通数据的存储和处理依然采用传统的串行化方法,由于数据量巨大,数据结构复杂,其计算完成时间已无法应用于实际场景。因此,采用并行化与分布式的数据处理技术来提高交通信息处理水平成为当前交通大数据平台研究的主流。建立综合运输服务大数据平台,促进交通运输大数据产业化应用成为迫切的行业需求。
现阶段,大多数研究主要集中在根据高速路网的历史数据进行路网运行分析,对路网的实时信息反馈较少;其中,一部分研究是根据路网中的实时的速度来对路网的运行状态进行分析,缺乏科学性和可靠性。如何在现有的高速路网环境下,利用获取的交通数据中,实时地分析出某个区域路网的交通流运行状态,是目前面临的重要问题。
发明内容
有鉴于此,本发明的目的是提供一种基于Spark的路网交通运行分析方法。
为实现上述目的,本发明的技术方案是:
一种基于Spark的路网交通运行分析方法,包括以下步骤:
1)首先利用5台PC机搭建包含一个主节点和四个从节点的Spark大数据机器学习平台;主节点作为大数据机器学习平台的控制节点,从节点作为大数据机器学习平台的工作节点,各节点间在一个局域网内通过千兆以太网进行互相连接通信;
2)以实时的交通流数据为基础,在Spark大数据机器学习平台上采用分布式k-means算法进行交通运行状态聚类,并输出最佳的交通运行状态聚类结果T′;
根据实际的交通流运行情况将最佳的交通运行状态聚类结果T′中不同簇中的交通流数据赋予一个交通运行状态,其最终的聚类结果为T={(xi,Mj);i=1,2,...,n;j=1,2,...,5},其中xi表示交通流运行数据,包括交通流量、速度和占有率,n为数据集记录数,Mj表示交通流运行数据聚类后的交通运行状态;
3)在交通运行状态聚类分析完成后,在Spark大数据机器学习平台上采用随机森林算法对最终的聚类结果T进行训练,利用训练完成的模型建立交通运行状态判别规则,实现路网交通运行状态判别。
本发明进一步的改进在于,步骤1)中,Spark大数据机器学习平台包括从上向下依次为数据应用层1、数据处理层2以及数据存储层3;其中数据存储层3选用分布式文件系统,用于底层数据存储管理,Spark直接读取HDFS上的数据进行计算并把结果再写回HDFS;数据处理层2利用Spark内建的独立调度器模式实现底层资源调度,同时,RDD进行数据处理任务的并行执行;数据应用层1,由Spark的多种大数据处理场景生态应用组件组成,其中包括SparkR、Spark SQL和Spark MLlib。
本发明进一步的改进在于,步骤2)中,交通流运行数据聚类后的交通运行状态为畅通、基本畅通、轻度拥堵、中度拥堵和严重拥堵五种交通运行状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长安大学,未经长安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910129703.7/2.html,转载请声明来源钻瓜专利网。