[发明专利]一种基于Transformer的车标识别方法及装置在审
申请号: | 202210471900.9 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114973111A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 韩成;班华忠;王正;崔凯;邓同华 | 申请(专利权)人: | 北京智芯原动科技有限公司 |
主分类号: | G06V20/50 | 分类号: | G06V20/50;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 transformer 标识 方法 装置 | ||
本发明提供了一种基于Transformer的车标识别方法,该方法包括:接收车辆图像;对车辆图像进行高宽固定比例补边、缩放、高宽32倍数补边处理,得到处理后的车辆图像;基于MobileNetV2网络和Transformer,构建车标识别网络;输入车辆样本图像,对车标识别网络进行反复训练,直至网络收敛,得到训练好的车标识别网络;将处理后的车辆图像输入到训练好的车标识别网络中,获得车标的识别结果并输出。与现有技术相比,本发明有更高的车标识别准确率,在车标反光、车标缺失的情况下也能很好的识别车标信息。
技术领域
本发明涉及图像处理、智慧停车、车牌识别,特别涉及一种基于Transformer的车标识别方法及装置。
背景技术
随着生活水平和工业水平的提高,机动车数量迅速增长,近年来通过图像识别车辆信息成为热点。常用的车辆信息识别方法主要通过识别车牌号码,然而对于无牌车、车牌污损或遮挡等情况,无法准确获取车辆信息,针对上述问题,今年来,如何识别车辆的品牌成为研究热点之一。
现有的车标识别方法主要是对车辆上的车标进行识别,进而判断车标。但存在以下问题:车标样式繁多,有图标和文字,且大小不一、高宽比不一,识别算法对小目标、高宽比极大的识别较为困难;由于反光、车标缺失、车标污损等情况,无法正确识别车标类型。
综上所述,目前迫切需要提出一种解决上述问题的基于Transformer的车标识别方法。
发明内容
有鉴于此,本发明的主要目的在于提供一种基于Transformer的车标识别方法,能够实现精度和速度并重。
为达到上述目的,按照本发明的第一个方面,提供了一种基于Transformer的车标识别方法,该方法包括:
第一步骤,接收车辆图像;
第二步骤,对车辆图像进行高宽固定比例补边、缩放、高宽32倍数补边处理,得到处理后的车辆图像;
第三步骤,基于MobileNetV2网络和Transformer,构建车标识别网络;输入车辆样本图像,对车标识别网络进行反复训练,直至网络收敛,得到训练好的车标识别网络;
第四步骤,将处理后的车辆图像输入到训练好的车标识别网络中,获得车标的识别结果并输出。
其中,所述第一步骤中的车辆图像是指车辆外接矩形框的子图像。
所述第二步骤包括:
高宽固定比例补边处理步骤,按照高宽固定比例、车辆图像的高度和宽度,计算固定比例后的高度和宽度;按照固定比例后的高度和宽度,将车辆图像进行外扩,外扩区域的像素补为0,得到第一车辆图像;
固定尺寸缩放处理步骤,按照固定尺寸,对第一车辆图像进行缩小或者放大,得到第二车辆图像;
高宽为32倍数补边处理步骤,将第二车辆图像的高度和宽度分别外扩至32的倍数,外扩区域的像素补为0,得到处理后的车辆图像。
所述高宽固定比例是根据相机采集的图像分辨率设定的。
所述第三步骤S3中车标识别网络包括:Input、CU、MU*1、MU*2、TU*2、MU*2、TU*3、MU*2、TU*2、MU*1、global pooling、Softmax。
其中,Input表示输入层;CU表示卷积单位,包括卷积层、BN层、激活函数(relu);MU表示MobilenetV2的单元模块,所述MobilenetV2的单元模块包括:CU、DU、CU,其中DU表示深度卷积单元,所述深度卷积单元包括:深度卷积层、BN层、激活函数(relu);TU表示Transformer的单元模块;global pooling表示全局池化层;Softmax表示Softmax损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智芯原动科技有限公司,未经北京智芯原动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210471900.9/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法