[发明专利]图像识别方法及相关装置有效
申请号: | 201911337591.0 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111126258B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 贺武;陈微;张鹏 | 申请(专利权)人: | 深圳市华尊科技股份有限公司 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/25;G06V10/52;G06V10/764;G06V10/77;G06V10/82;G06N3/04;G06N3/082 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 相关 装置 | ||
1.一种图像识别方法,其特征在于,应用于电子设备,所述方法包括:
获取目标图像;
将所述目标图像输入到主干网络进行特征提取,得到不同尺度下的多个第一特征图,所述主干网络的每一尺度所在层均为通过通道注意力模块进行自注意力蒸馏学习以及所述主干网络的每一尺度所在层均为通过空间注意力模块进行特征融合提取;
通过所述多个第一特征图进行后处理,得到至少一个目标;
确定所述多个第一特征图对应的空间注意力特征图,得到多个第一空间注意力特征图,依据所述多个第一空间注意力特征图确定第一感兴趣区域特征图;
将所述第一感兴趣区域特征图输入到所述主干网络进行特征提取,得到不同尺度下的多个第二特征图;
通过所述多个第二特征图进行目标属性识别确定至少一个目标属性;
将所述至少一个目标和所述至少一个目标属性作为目标图像识别结果;
其中,所述通过所述多个第一特征图后处理,得到至少一个目标,包括:
通过目标神经网络模型将所述多个第一特征图进行后处理,得到所述至少一个目标;
所述目标神经网络模型包括BatchNorm层,且所述BatchNorm层已添加蒙版,实现对抗稀疏训练,该稀疏训练用于所述目标神经网络模型剪枝压缩;
其中,所述方法还包括:
获取第一训练集,所述第一训练集包括多个样本;
对所述第一训练集的样本进行扰动操作,得到第二训练集;
将所述第一训练集和所述第二训练集输入到预设神经网络进行对抗训练,得到所述目标神经网络模型;
其中,所述将所述第一训练集和第二训练集输入到预设神经网络进行对抗训练,得到所述目标神经网络模型,包括:
获取样本k,所述样本k为所述第一训练样本和所述第二训练样本中的任一样本;
将所述样本k输入到所述主干网络,得到不同尺度下的多个第一尺度特征图;
依据所述多个第一尺度特征图确定多个通道注意力特征图;
依据所述多个通道注意力特征图进行自注意力蒸馏,以学习多尺度下的更加丰富的融合特征,并利用学习之后的所述多个通道注意力特征图优化所述主干网络;
和/或,
确定所述多个第一尺度特征图对应的空间注意力特征图,得到多个第二空间注意力特征图;
依据所述多个第二空间注意力特征图确定第二感兴趣区域特征图;
将所述第二感兴趣区域特征图输入到所述主干网络进行特征提取,得到不同尺度下的多个第二尺度特征图;
依据所述多个第二尺度特征图确定多个第三空间注意力特征图;
依据所述多个第三空间注意力特征图进行特征融合提取,以学习局部细粒度特征,并利用特征融合提取后的所述多个第三空间注意力特征图优化所述主干网络。
2.根据权利要求1所述的方法,其特征在于,所述确定所述多个第一特征图对应的空间注意力特征图,得到多个第一空间注意力特征图,依据所述多个第一空间注意力特征图确定第一感兴趣区域特征图,包括:
对所述多个第一特征图进行分组操作,得到多组第一特征图;
对所述多组第一特征图中每一组第一特征图进行全局平均池化操作,得到多组重要性权重特征,每一组第一特征图对应一组重要性权重特征;
将所述多组第一特征图和所述多组重要性权重特征进行点乘mul运算,得到多组特征图;
将所述多组特征图进行最大响应缩减,得到多个单通道特征图;
将所述多个单通道特征图输入到激活函数,得到多个第一空间注意力特征图;
将所述多个第一空间注意力特征图进行concat操作,以融合为目标空间注意力特征图;
对所述目标空间注意力特征图进行感兴趣区域提取,得到所述第一感兴趣区域特征图。
3.根据权利要求1所述的方法,其特征在于,所述依据所述多个第一尺度特征图确定多个通道注意力特征图,包括:
将所述多个第一尺度特征图中每一第一尺度特征图输入到所述通道注意力模块,得到中间通道注意力特征图,并利用浅层的中间通道注意力特征图优化深层的中间通道注意力特征图,得到所述多个通道注意力特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华尊科技股份有限公司,未经深圳市华尊科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911337591.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序