[发明专利]一种基于YOLOv3模型的车辆品牌多角度识别方法有效
| 申请号: | 201910419456.4 | 申请日: | 2019-05-20 |
| 公开(公告)号: | CN110119726B | 公开(公告)日: | 2023-04-25 |
| 发明(设计)人: | 王成中;徐健飞;杨贤柱;贾东 | 申请(专利权)人: | 四川九洲视讯科技有限责任公司 |
| 主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/762;G06V10/774;G06N3/0464;G06V10/82 |
| 代理公司: | 四川省成都市天策商标专利事务所(有限合伙) 51213 | 代理人: | 王荔 |
| 地址: | 621000 四川省绵*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 yolov3 模型 车辆 品牌 角度 识别 方法 | ||
1.一种基于YOLOv3模型的车辆品牌多角度识别方法,其特征在于,所述方法包括如下步骤:
步骤1:采集图片,并对采集到的每张图片都进行标注,分别标注出车辆区域左上角和右上角在原图像上面的坐标,以及车辆的方向,并分类为正面、反面和侧面;
步骤2:对每张图片中每个标注了的车辆的长宽比进行统计,用无监督学习算法K-Means对所有目标的长宽比进行聚类得到9个聚类中心;
步骤3:使用步骤2所得的聚类中心优化YOLOv3模型,将原模型的输入尺寸由416*416改成672*672,使得模型对小目标的敏感度更高;
步骤4:根据步骤3优化后的YOLOv3模型检测监控视频中车辆的位置信息和车身方向;
步骤5:根据步骤4中检测得到的目标车辆的位置信息将车辆区域截取并筛选,然后进行数据预处理;
步骤6:收集数据,选择不同场景,不同天气,各种光线下只包含整个车辆区域,背景尽可能少的图像作为训练集对YOLOv3模型进行优化;
所述优化步骤具体为:
步骤6.1:收集数据,选择不同场景,不同天气,各种光线下只包含整个车辆区域,背景尽可能少的图像作为训练集;
步骤6.2:对每张图片进行标注,画出车头或者车尾部位包含车标的那一部分的区域,将区域左上角和右下角的坐标和品牌类别标注出来;
步骤6.3:根据标注的坐标计算每张图片中标注区域的长宽比并进行统计,将统计结果作为数据,采用无监督学习算法K-Means对所有感兴趣区域的长宽比进行聚类,得到3个聚类中心;
步骤6.4:使用步骤6.3所得3个聚类中心的长宽比值将原模型的输入尺寸由416*416改进成224*224,减小了不必要的计算量,完成对yolov3模型的优化;
步骤7:利用改进后的YOLOv3模型检测识别中车辆图像的品牌,并比较得到的品牌识别结果,并筛选出车辆的品牌。
2.根据权利要求1所述的基于YOLOv3模型的车辆品牌多角度识别方法,其特征在于,所述步骤4检测监控视频中车辆的位置信息和车身方向的过程为:
首先利用改进后的yolov3模型与利用相似度比较的模板匹配算法结合对视频中的车辆进行检测并跟踪,模型通过多尺度特征提取对输入的每一帧图像提取特征;
然后Yolov3将darknet-53作为神经网络模型,拥有53层卷积网络,其中有5层卷积网络作为下采样层;
最后,模型分别将第三次,第四次,第五次下采样层输出的特征图依次融合,得到含有特征尺寸为21*21,42*42,84*84的多尺寸特征图,让网络同时学习深层和浅层的特征,模型最后输出值为:
其中class为类别种类,i为类别索引,Pi为置信度,IOU是预测的位置和真实位置的交并比。
3.根据权利要求1所述的基于YOLOv3模型的车辆品牌多角度识别方法,其特征在于,所述步骤5中对目标车辆的位置信息将车辆区域截取和筛选时,按照目标的预测坐标将车辆图像从每一帧原始图像中截取下来根据类别存储,然后将每一类中置信度最大的车辆图像提取出来作为车辆品牌识别的数据;预处理包括对图像进行滤波和压缩的处理。
4.根据权利要求1所述的基于YOLOv3模型的车辆品牌多角度识别方法,其特征在于,所述步骤7检测车辆品牌时,先修改过模型的输入尺寸后,经过5次下采样处理得到7*7的特征图;模型检测识别后,得到车辆正面图像的品牌分类结果class1置信度P1,车辆反面图像的品牌分类结果class0置信度P0及车辆侧面图像的分类结果class2置信度P2。
5.根据权利要求4所述的基于YOLOv3模型的车辆品牌多角度识别方法,其特征在于,检测完毕后比较车辆三个方向的图像的品牌检测结果;
如果三个图像品牌分类结果一样,则目标车辆品牌为class1;
如果三个图像品牌分类结果有两个相同,另一个不相同,则目标车辆的品牌为那两个结果一样的品牌;
如果三个图像品牌分类结果均不一致,则比较置信度P1、P0和P2的大小,选择置信度最大的分类结果作为目标车辆的品牌。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川九洲视讯科技有限责任公司,未经四川九洲视讯科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910419456.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于检测信号灯的方法及装置
- 下一篇:指纹识别方法、装置、终端及存储介质





