[发明专利]一种适用于鱼类细粒度识别的深度学习方法在审
| 申请号: | 201811495457.9 | 申请日: | 2018-12-07 |
| 公开(公告)号: | CN109815973A | 公开(公告)日: | 2019-05-28 |
| 发明(设计)人: | 冀中;赵可心 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 空间变换 细粒度 图像 鱼类 归一化处理 网络 双线性 卷积神经网络 注意力机制 反向传播 复杂背景 局部区域 目标区域 输入空间 算法优化 特征提取 图像类别 网络捕获 有效获取 分类器 鲁棒性 分类 准确率 去除 送入 学习 响应 | ||
一种适用于鱼类细粒度识别的深度学习方法,包括:将原图输入空间变换网络捕获图像中具有判别性的目标区域;使用双线性卷积神经网络网络进行特征提取;对图像的双线性特征φ(I)进行归一化处理;将归一化处理结果送入softmax分类器进行分类得到图像类别。本发明加入了作为注意力机制的空间变换网络,空间变换网络能去除图像中的复杂背景,有效获取图像中感兴趣的区域,提高后续分类精度。本发明设计的加入空间变换网络的BCNN对目标中具有判别性的局部区域有较强响应,最终识别准确率高。此外,本发明简单可行,是一个端对端的网络,利用反向传播算法优化,能够有效用于鱼类细粒度识别,并且具有很好的鲁棒性和泛化能力。
技术领域
本发明涉及一种深度学习方法。特别是涉及一种适用于鱼类细粒度识别的深度学习方法。
背景技术
近年来,水下观测事业迅速发展,水下目标识别的需求也日益剧增。其中,鱼类细粒度识别是重要任务之一,它有益于海洋科学家和生物学家等学术研究人员的研究以及鱼类养殖等商业应用。此外,通过鱼类识别,我们可以获得某些特定鱼类的分布,统计鱼群数量,进而可以监测评估鱼类种群以及生态系统,分析海洋环境的变化等。
传统的鱼类识别研究依赖于手工提取的特征,这些方法是任务驱动的,泛化能力弱。Strachan等人提出了一种基于图像形状分析的鱼类识别方法,在三种鱼类中分别达到73%,63%和90%。Larsen等人基于形状和纹理对三种鱼类进行分类并达到76%的识别率。Huang等人提出了一种平衡保证优化树(BGOT)算法来控制层次分类中的误差累积。他们对包含从水下录像中收集的10种物种的3179条鱼图像的数据集进行了实验,得到了95%的准确度。Huang等人进一步使用高斯混合模型(GMM)来改进层次分类中的拒绝选项。使用BGOT+GMM,在包含15种物种的24150幅图像的较大大型数据集上,它们的平均精度为65%。
卷积神经网络的出现推动了计算机视觉领域的迅速发展,卷积神经网络以其局部权值共享的特殊结构在图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。
传统的算法在大型数据集上效率不高,而且准确性并不令人满意。近几年,鱼类识别研究也有一些应用深度学习的算法。Guoqing Ding等人设计了3种不同深度的卷积神经网络结构用于鱼类识别。Xin Sun等人提出了将超分辨率与分类相结合的方法。MengCheChuang等人提出了一个由无监督特征学习技术和错误恢复分类器组成的水下鱼类识别框架。Hongwei Qin等人提出了一个用于鱼类分类的深度网络。
之前的鱼类研究工作中,很少有方法针对细节特征进行识别,而本发明加入了可以作为注意力机制的空间变换网络来选择感兴趣的目标区域,再运用B-CNNs网络进一步学习局部细节特征,以适应鱼类图像的角度多样、姿态复杂。
发明内容
本发明所要解决的技术问题是,提供一种能够准确识别鱼类的适用于鱼类细粒度识别的深度学习方法。
本发明所采用的技术方案是:一种适用于鱼类细粒度识别的深度学习方法,包括如下步骤:
1)将原图输入空间变换网络捕获图像中具有判别性的目标区域;
2)使用双线性卷积神经网络网络进行特征提取;
3)对图像的双线性特征φ(I)进行归一化处理;
4)将归一化处理结果送入softmax分类器进行分类得到图像类别。
步骤1)包括:
(1)将原图输入由全连接层构成的定位网络,输出一个6维的变换参数θ;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811495457.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





