[发明专利]针对任意视角汽车图片的细粒度车型识别方法有效
申请号: | 201811569579.8 | 申请日: | 2018-12-21 |
公开(公告)号: | CN109753999B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 袁媛;王琦;郑全全 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/774;G06V10/764;G06V10/82;G06N3/04 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 任意 视角 汽车图片 细粒度 车型 识别 方法 | ||
本发明公开了一种针对任意视角汽车图片的细粒度车型识别方法,用于解决现有车型识别方法车型识别准确率低的技术问题。技术方案是首先根据Stanford Cars数据集训练第一个分支网络,再对原始图片中的汽车区域进行定位,得到裁剪后的图片,使用裁剪后的图片训练第二个分支网络,利用Selective Search方法处理裁剪后的图片,得到多幅子图,使用第二个分支网络对这些子图进行筛选,将保留下来的图片送入第三个分支网络进行训练,然后确定每个分支网络的输出权重,将原始图片送入三个分支网络中,对网络的输出加权求和,最大输出值对应的类别即为车型类别。由于采用深度卷积神经网络提取特征,提高了车型识别的准确率。
技术领域
本发明涉及一种车型识别方法,特别涉及一种针对任意视角汽车图片的细粒度车型识别方法。
背景技术
随着科技的发展,汽车成为了越来越普遍的交通工具,随之而来的车辆管理的问题也凸显了出来。为了解决这个问题,智能交通系统应运而生,而作为智能交通系统重要组成部分的车型识别系统也成为了热门的研究内容。近些年提出的车型识别方法主要分为两大类:传统方法和深度学习方法。
传统方法主要是利用一些人工设计的特征进行车型识别,例如MCNMS Nagmode在文献“Nagmode M C N M S.Vehicle Classification using SIFT[C]//InternationalJournal of Engineering Research and Technology.ESRSA Publications,2014.”中提出使用SIFT特征进行车型识别。但是采用传统的人工设计的特征来描述图像,不能够很好的描述图像的高层语义信息,从而使得识别的准确率不能够很理想,并且特征表示的泛化能力较差。
深度学习方法主要是利用卷积神经网络学习特征,从而利用学习到的特征进行车型识别分类,例如“Huang K,Zhang B.Fine-grained vehicle recognition by deepConvolutional Neural Network[C]//2016 9th International Congress on Image andSignal Processing,BioMedical Engineering and Informatics(CISP-BMEI).IEEE,2016:465-470.”中提出的车型识别方法。该文章中的车型识别方法的只是使用普通的卷积神经网络和R-CNN结合来进行分类,并没有针对细粒度分类这个特殊问题进行一些特别的设计,所以得到的识别准确率较低,在50类的车型数据集上,平均只得到了百分之六十的识别准确率,并且该方法仅针对视角固定的汽车图片进行分类识别。
发明内容
为了克服现有车型识别方法车型识别准确率低的不足,本发明提供一种针对任意视角汽车图片的细粒度车型识别方法。该方法首先根据Stanford Cars数据集训练第一个分支网络,再使用faster r-cnn对原始图片中的汽车区域进行定位,去除大部分背景,得到裁剪后的图片,使用裁剪后的图片训练第二个分支网络,利用Selective Search方法处理裁剪后的图片,得到多幅子图,使用第二个分支网络对这些子图进行筛选,将保留下来的图片送入第三个分支网络进行训练,然后确定每个分支网络的输出权重,将原始图片和经过faster rcnn和Selective Search生成的图片分别送入三个分支网络中,对网络的输出加权求和,此时最大输出值对应的类别即为所识别的车型类别。本发明不仅提高了车型识别准确率,并且能够对任意视角的汽车图片进行识别。
本发明解决其技术问题所采用的技术方案:一种针对任意视角汽车图片的细粒度车型识别方法,其特点是包括以下步骤:
步骤一、先将数据集原始图片送入VGG网络中进行训练,训练具有识别n类车型能力的网络模型,所述网络模型的训练是在ImageNet上预训练好的网络模型的基础上进行finetuning训练,完成第一个分支网络的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811569579.8/2.html,转载请声明来源钻瓜专利网。