[发明专利]一种车辆/行人检测方法及系统有效
| 申请号: | 201710224733.7 | 申请日: | 2017-04-07 |
| 公开(公告)号: | CN107133570B | 公开(公告)日: | 2018-03-13 |
| 发明(设计)人: | 陈瑞军;王兴刚;胡滨;段雄 | 申请(专利权)人: | 武汉睿智视讯科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 武汉东喻专利代理事务所(普通合伙)42224 | 代理人: | 李佑宏 |
| 地址: | 430074 湖北省武汉市东湖开发*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 车辆 行人 检测 方法 系统 | ||
技术领域
本发明属于计算机视觉领域,具体涉及一种车辆/行人检测方法及系统。
背景技术
计算机视觉技术的发展,对于智能交通系统起到了很大的帮助,其中车辆及行人检测技术,更是智能交通监控系统的核心技术。在实际的应用中,视频及图片是获取车辆、行人身份信息的重要途径。通常,视频、图片中包含有大量的车辆、行人信息,车辆及行人检测技术就是这样一种从大量信息中筛选出有效信息的计算机视觉技术。
车辆及行人检测技术,主要是为了帮助识别监控视频或图片中的车辆和/或行人,并对其进行身份确认。一般来说,车辆及行人检测技术是通过算法获取车辆、行人的特征数据,以此作为判断根据。智能交通监控系统对于所监控场景的智能分析,如车辆轨迹、车辆行为、异常检测等,很大程度上都需要依赖于车辆检测技术的结果。因此,高效、鲁棒的车辆检测方法对于智能交通监控系统具有重要的意义。
现有技术的车辆检测方法,主要有两种。具体的,如CN201610601274所公开的车辆识别方法及系统,是按照车辆姿态将多个车辆图像分为不同的类别,基于每个类别的车辆图像特征分别训练不同类别的车辆姿态分类器,进而对待测车辆图像进行识别。这种方法对车辆图像姿态分类过多,需要进行大量的分类器训练,每一个分类训练器只能进行一种特征姿态的分类活动,其处理的过程过于复杂。除此之外,其还需要大量的车辆和行人数据作为分类基础。又如CN201310020953所公开的车辆识别方法,其先对视频图片进行前景检测,提取到车辆图像的特征点后,将这些特征数据与预先纪录的特征数据、颜色进行比对,以确定检测车辆是否是目标车辆。其需要预先录入大量特定目标的标记数据,对于多数不确定目标的车辆和/或行人识别效果并不明显。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种车辆/行人检测方法及系统。本发明提供的方法及系统,只需要对一个识别器进行训练,只需要少量的训练数据,就可以实现快速识别待测图像中的车辆和行人。且该方法及系统不光可以对单一、具体的目标进行识别,对多数不特定目标的识别效果也很好。
为实现上述目的,按照本发明技术方案的一方面,提供了一种车辆/行人检测方法,其特征在于,包括以下步骤:
S1提取训练图像的深度卷积特征图;
S2获取训练图像的目标候选区域;
S3利用训练图像的深度卷积特征图,获取训练图像的目标候选区域的池化特征;
S4基于训练图像的目标候选区域的池化特征,训练检测器,得到车辆/行人候选区域分类模型;
S5利用车辆/行人候选区域分类模型检测待检测车辆/行人图像获得车辆和/或行人的类别和/或位置。
本发明技术方案提供的车辆、行人检测方法中,检测器的行为主要分为两个部分,识别训练和检测识别。具体来说,第一步,采用半监督深度神经网络方法对检测器进行训练,使其具备一定的自我学习和识别能力,从而获得一个车辆、行人候选区域分类模型。第二步,采用上述车辆、行人候选区域分类模型对待测车辆、行人图像进行识别,区分出其中车辆和/或行人的类别和/或位置信息,并作出相应的信息报告。
本发明技术方案中,检测器的识别训练,需要经过多个步骤。车辆、行人图像集中的训练图像作为检测器的训练基础,其并不能直接用于对检测器进行训练,而是需要经过一系列图像处理过程,提取到每张训练图像中的特征点,并进行计算处理后,才能对检测器进行训练。具体来说,对于车辆、行人图像集中的任意训练图像,第一步需要提取其深度卷积特征图,一般是采用卷积神经网络(CNN)完成上述工作。第二步,对于第一步中的图像使用选择性搜索算法提取图像中的目标候选区域,一般来说,这些候选区域中包含有车辆和/或行人的类别和/或位置信息。图像经过上述处理后,获得一定数量的目标区域,本发明技术方案中,目标区域数量优选为2000。第三步,利用第一步中获得的卷积特征图进行映射,将第二步中获得的每个目标区域进行池化,获取每个目标候选区域的ROI(region of intrest)池化特征,最终每个ROI会输出一定数量的固定尺寸特征图。最后,对车辆、行人图像集中的每张训练图像进行上述处理,获得每张图像的数据信息,采用半监督深度神经网络的方法,来对检测器进行训练,以得到车辆/行人候选区域分类模型。
作为本发明的一个优选技术方案,步骤S4具体包括:
S41标记训练图像的车辆/行人所在位置和/或类别,其中所述标记包括包含位置信息和类别信息的全标记以及仅包含类别信息的半标记;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉睿智视讯科技有限公司,未经武汉睿智视讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710224733.7/2.html,转载请声明来源钻瓜专利网。





