[发明专利]一种适用于鱼类细粒度识别的深度学习方法在审
| 申请号: | 201811495457.9 | 申请日: | 2018-12-07 |
| 公开(公告)号: | CN109815973A | 公开(公告)日: | 2019-05-28 |
| 发明(设计)人: | 冀中;赵可心 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 空间变换 细粒度 图像 鱼类 归一化处理 网络 双线性 卷积神经网络 注意力机制 反向传播 复杂背景 局部区域 目标区域 输入空间 算法优化 特征提取 图像类别 网络捕获 有效获取 分类器 鲁棒性 分类 准确率 去除 送入 学习 响应 | ||
1.一种适用于鱼类细粒度识别的深度学习方法,其特征在于,包括如下步骤:
1)将原图输入空间变换网络捕获图像中具有判别性的目标区域;
2)使用双线性卷积神经网络网络进行特征提取;
3)对图像的双线性特征φ(I)进行归一化处理;
4)将归一化处理结果送入softmax分类器进行分类得到图像类别。
2.根据权利要求1所述的一种适用于鱼类细粒度识别的深度学习方法,其特征在于,步骤1)包括:
(1)将原图输入由全连接层构成的定位网络,输出一个6维的变换参数θ;
(2)网格生成器首先创建与输入图像相同大小的归一化网格,归一化网格应用2D仿射变换,将定位网络输出的66维的变换参数θ重塑为2×3矩阵,并执行如下公式,生成参数化采样网格Tθ(G),
式中,是归一化网格的目标坐标;是输入图像的坐标,定义了所需的采样点;Aθ是2×3矩阵;
(3)将参数化采样网格Tθ(G)以及原图输入采样器,所述的采样器采用双线性插值法通过如下公式输出尺寸为224×224的图像,
式中,I是高为H,宽为W,通道数为C的图像,是输入图像通道c中坐标为(n,m)处的值,是输入图像通道c中坐标为处像素i的输出值,对于输入图像的每个通道都采用双线性插值法获得输出图像的像素值。
3.根据权利要求1所述的一种适用于鱼类细粒度识别的深度学习方法,其特征在于,步骤2)包括:
将224×224的图像经过VGG16第五段卷积后得到14×14×512的特征图,将所述的特征图转置再与原特征图进行外积操作,得到图像的双线性特征φ(I)表示:
式中,I表示图像,B表示双线性特征函数,l表示图像位置,fconv5表示图像经过VGG16第五段卷积后得到14×14×512的特征图。
4.根据权利要求1所述的一种适用于鱼类细粒度识别的深度学习方法,其特征在于,步骤3)包括将双线性特征φ(I)通过如下公式进行符号平方根运算后,再进行l2归一化。
式中,y表示运算结果,sign表示符号函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811495457.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





