[发明专利]一种基于破坏学习与注意力机制的车型分类网络训练方法在审
申请号: | 202110025249.8 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112733712A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 王秋思 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/42;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 200032 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 破坏 学习 注意力 机制 车型 分类 网络 训练 方法 | ||
1.一种基于破坏学习与注意力机制的车型分类网络训练方法,基于特征提取神经网络与softmax回归函数,其特征在于,具体包括以下步骤:
S1、获取需要进行车辆分类的待测车辆的初始图像,根据破坏学习的破坏机制将初始图像进行多尺度裁剪,形成多个尺度对应的子图像;
S2、根据特征提取神经网络的卷积层提取子图像的特征图;
S3、小尺度子图像的特征图进行上采样后,与大尺度子图像的特征图进行通道拼接,形成初始特征图层并发送到通道注意力模块;
S4、所述初始特征图层在通道注意力模块经过处理得到通道权重矩阵,根据所述通道权重矩阵计算得到子图像的加权特征图;
S5、多尺度的子图像的加权特征图根据softmax回归函数,计算得到初始图像对应的目标图像类别。
2.根据权利要求1所述的一种基于破坏学习与注意力机制的车型分类网络训练方法,其特征在于,所述步骤S4具体包括:
S4-1、所述初始特征图层经过卷积层得到第一特征图层,所述第一特征图层经过重塑得到第二特征图层和第四特征图层,所述第一特征图层经过重塑并转置得到第三特征图层,所述第二特征图层和第三特征图层相乘经过softmax回归函数后得到通道权重矩阵;
S4-2、所述第四特征图层与通道权重矩阵相乘,得到子图像的加权特征图。
3.根据权利要求2所述的一种基于破坏学习与注意力机制的车型分类网络训练方法,其特征在于,所述通道权重矩阵的大小为第三特征图层的大小的平方。
4.根据权利要求1所述的一种基于破坏学习与注意力机制的车型分类网络训练方法,其特征在于,所述初始图像为单通道图像。
5.根据权利要求4所述的一种基于破坏学习与注意力机制的车型分类网络训练方法,其特征在于,所述每个尺度的子图像拼接后形成初始图像的多通道图像。
6.根据权利要求5所述的一种基于破坏学习与注意力机制的车型分类网络训练方法,其特征在于,所述多通道图像的通道数为相应尺度的高度裁剪比例和宽度裁剪比例的乘积的倒数。
7.根据权利要求1所述的一种基于破坏学习与注意力机制的车型分类网络训练方法,其特征在于,所述通道权重矩阵的权重参数表征初始特征图层中各通道间的关系密切程度。
8.根据权利要求1所述的一种基于破坏学习与注意力机制的车型分类网络训练方法,其特征在于,所述步骤S1中每个尺度包括多个子图像。
9.根据权利要求8所述的一种基于破坏学习与注意力机制的车型分类网络训练方法,其特征在于,所述同尺度的子图像的尺寸相同。
10.根据权利要求8所述的一种基于破坏学习与注意力机制的车型分类网络训练方法,其特征在于,所述大尺度的子图像的尺寸大于小尺度的子图像的尺寸。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110025249.8/1.html,转载请声明来源钻瓜专利网。