[发明专利]一种基于Transformer的车标识别方法及装置在审
申请号: | 202210471900.9 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114973111A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 韩成;班华忠;王正;崔凯;邓同华 | 申请(专利权)人: | 北京智芯原动科技有限公司 |
主分类号: | G06V20/50 | 分类号: | G06V20/50;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 transformer 标识 方法 装置 | ||
1.一种基于Transformer的车标识别方法,其特征在于,该方法包括:
第一步骤,接收车辆图像;
第二步骤,对车辆图像进行高宽固定比例补边、缩放、高宽32倍数补边处理,得到处理后的车辆图像;
第三步骤,基于MobileNetV2网络和Transformer,构建车标识别网络;输入车辆样本图像,对车标识别网络进行反复训练,直至网络收敛,得到训练好的车标识别网络;
第四步骤,将处理后的车辆图像输入到训练好的车标识别网络中,获得车标的识别结果并输出;
进一步地,所述第二步骤包括:
高宽固定比例补边处理步骤,按照高宽固定比例、车辆图像的高度和宽度,计算固定比例后的高度和宽度;按照固定比例后的高度和宽度,将车辆图像进行外扩,外扩区域的像素补为0,得到第一车辆图像;
固定尺寸缩放处理步骤,按照固定尺寸,对第一车辆图像进行缩小或者放大,得到第二车辆图像;
高宽为32倍数补边处理步骤,将第二车辆图像的高度和宽度分别外扩至32的倍数,外扩区域的像素补为0,得到处理后的车辆图像;
其中,所述高宽固定比例是根据相机采集的图像分辨率设定的。
2.如权利要求1所述的方法,其特征在于,所述固定尺寸为以下的一种:高度是192个像素、宽度是108个像素;高度是224个像素、宽度是126个像素。
3.如权利要求1所述的方法,其特征在于,所述车标识别网络包括:Input、CU、MU*1、MU*2、TU*2、MU*2、TU*3、MU*2、TU*2、MU*1、global pooling、Softmax;
其中,Input表示输入层;CU表示卷积单位,包括卷积层、BN层、激活函数(relu);MU表示MobilenetV2的单元模块,所述MobilenetV2的单元模块包括:CU、DU、CU,其中DU表示深度卷积单元,所述深度卷积单元包括:深度卷积层、BN层、激活函数(relu);TU表示Transformer的单元模块;global pooling表示全局池化层;Softmax表示Softmax损失函数;其中,所述“*1”代表重复1次,所述“*2”代表重复2次,所述“*3”代表重复3次。
4.如权利要求3所述的方法,其特征在于,所述MU和CU两个单元模块的衔接方法包括:经过MU输出特征图H、W、C分别为特征图F的高、宽、通道数;将特征图F经过1x1xCxd的卷积模板,将通道数变为d,得到特征图将特征图FL展开为N个不重叠的patch,得到其中P=w×h,将特征图FU经过L次Transformer模块,得到将特征图FG还原成之前的形状再使用1x1xdxC的卷积模板,将通道数还原成C得到其中,所述patch表示小块,h和w分别表示patch的高度和宽度,P表示patch的尺寸,N表示特征图展开成patch的个数。
5.如权利要求4所述的方法,其特征在于,所述w的取值为2或者4或者6,h的取值为2或者4或者6;所述L的取值为2或者3或者4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智芯原动科技有限公司,未经北京智芯原动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210471900.9/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法