[发明专利]一种基于Hadoop的套牌车识别方法及系统有效
申请号: | 201410407364.1 | 申请日: | 2014-08-18 |
公开(公告)号: | CN104200669B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 陈琼;汪劲松;陈志云 | 申请(专利权)人: | 华南理工大学;广东赛诺科技股份有限公司 |
主分类号: | G08G1/017 | 分类号: | G08G1/017;G06F17/30 |
代理公司: | 广州市华学知识产权代理有限公司44245 | 代理人: | 蔡茂略 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hadoop 套牌车 识别 方法 系统 | ||
技术领域
本发明涉及大数据分析领域,特别涉及一种基于Hadoop的套牌车识别方法及系统。
背景技术
随着我国国民经济水平的增长,机动车保有量每年都在迅速增长,查处各种交通违法违章现象是确保交通安全的重要举措。在各种交通违法违章中,车辆“套牌”是具有严重危害的违法行为。车辆“套牌”现象,指车辆非法使用与其他合法车辆相同的车牌号的现象。根据各地媒体的报道,“套牌”车辆严重危害交通运输行业及其运营秩序,对人们的安全及合法车辆的利益形成严重的威胁。不法分子套用他人车辆牌照,逃避肇事责任、逃避税费和从事犯罪活动,严重影响了人民的生命财产安全,扰乱了社会秩序,危害了社会安全。治理“套牌”车辆,已成为各地公安部门和交通管理部门的重要任务。
已有文献和公开的专利提出了套牌车的识别方法。目前的主要方法有车辆信息对比法和车辆行驶地点判别法。车辆信息对比法是在交通管理中心建立一个登记车辆信息库,通过物联网或视频图像分析获得的车辆信息和数据库中的车辆信息比对,如果不符,则该车牌是可疑套牌。如杨博提出的基于物联网的套牌车检测方法,采用电子标签技术,将存储了机动车车牌和发动机号等信息的电子标签植入机动车,当机动车驶入布防的监控点覆盖的范围时,电子标签中的信息被自动读出来,和交通管理部门数据库中的车辆信息比对,信息不符则被认定为套牌车。专利申请号为201310170646的方法是建立车型特征库和车辆基础库,根据采集的车辆图像识别车辆车牌、车型等,并与根据车牌从车型特征库中检索获得的车型进行比对识别套牌车辆。专利申请号为200910099475的方法是只要具有相同车牌号的两辆以上的车辆同时出现在路上,根据出现的时间和地点识别是否套牌。宁波大学通过设置于车辆数据信息处理中心中的时间矩阵、输入缓存区、窗口索引表、窗口数据存储区提高了识别速度,实现在线识别。
上述方法在实际应用时存在一些弊端。基于物联网的套牌车识别方法需要给机动车植入电子标签和部署无线监测点,成本较高;基于图像和视频的方法受光照、环境影响较大,准确率不高,车辆行驶地点判别法需要处理的数据量大,要求处理系统的效率足够高。这些方法都需要对每个经过监测点的车辆进行分析和处理,计算量和数据量大。由于套牌车的活动范围很广,监测点越多,采集的车辆信息越多时,将能更多地识别出套牌车牌。对于一个车辆保有量巨大的城市而言,每天采集的车辆数据量达到TB级,采用文件存储或数据库存储方式,对数据的查询和分析的效率是十分低下的,按单台计算机100MB/sec计算,读取2TB数据需要1.5小时,在此基础上实现查询分析几乎是不可完成的任务,采用SQL数据库是较常用的方法,但数据库需要足够强大的计算机,在TB及以上数据处理中,数据库的数据管理和优化难度极大。
为实现快速有效地分析大规模的交通车辆数据,需要一种新的技术方案来满足交管部门的需求。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于Hadoop的套牌车识别方法。
本发明的另一目的在于提供一种基于Hadoop的套牌车识别系统。
本发明的目的通过以下的技术方案实现:
一种基于Hadoop的套牌车识别方法,包含以下顺序的步骤:
S1.对各个智能卡口系统采集的过往车辆的信息进行预处理汇总,采用HBase分布式数据库组织数据,进行分布式存储;
S2.利用Hadoop分布式框架对车流数据和卡口数据进行建模和分析,通过Map-Reducer的编程框架实现可疑套牌车识别:
(1)通过卡口的位置信息计算距离,对车流信息用正态分布拟合经过卡口的速度值,用奇异值检测方法,过滤异常速度值,统计得到卡口间的平均速度,求得卡口间的理论行驶时间;
(2)根据车量通过卡口的时间得到实际行驶时间,当实际行驶时间明显小于理论行驶时间,则该车为可疑套牌车;
S3.对可疑套牌车进行行驶轨迹分析,建立套牌车预警信息库。
所述的步骤S1,具体包含以下顺序的步骤:
(1)将各个智能卡口系统采集的过往车辆车流信息的EXCEL格式文件转换成CSV格式文件;
(2)利用基于相似度的匹配算法对卡口数据文件和车流数据文件中的卡口信息进行重新匹配;
(3)对数据进行规范和去噪处理;
(4)将转化完成后的统一格式文件,保存到HBase分布式数据库中。
所述的步骤S2,具体包含以下步骤:
A、加载卡口信息数据,包括卡口名称和位置经纬度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;广东赛诺科技股份有限公司,未经华南理工大学;广东赛诺科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410407364.1/2.html,转载请声明来源钻瓜专利网。