[发明专利]一种基于深度学习的抗遮挡与多尺度死鱼识别系统与方法有效
申请号: | 202110653176.7 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113420759B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 杨明东;张先奎;陈静;杨勇;周红坤;杨飞 | 申请(专利权)人: | 中国船舶重工集团公司七五0试验场 |
主分类号: | G06V10/30 | 分类号: | G06V10/30;G06V10/774;G06V10/80;G06V10/25;G06T5/40;G06T3/60 |
代理公司: | 昆明今威专利商标代理有限公司 53115 | 代理人: | 赛晓刚 |
地址: | 650051 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 遮挡 尺度 识别 系统 方法 | ||
1.一种基于深度学习的抗遮挡与多尺度死鱼识别系统,其特征在于包括:
死鱼识别数据集模块,用于获取并保存水下拍摄的水下图像,用于构建死鱼识别训练集、验证集与测试集;
图像特征提取模块,用于对水下图像进行预处理,提取图像底层边缘和高层抽象特征图;
多尺度特征加强模块,用于通过串联多个特征金字塔的方式,提高特征的多尺度表达能力;生成候选框对前景目标进行表示,并能自适应提取和融合不同尺度的区域候选框特征;所述多尺度特征加强模块,包括多阶段特征金字塔、跨阶段连接单元及多尺度特征生成三个部分;跨阶段连接单元将上一阶段的特征传播到下一阶段,使当前特征能充分重利用之前的先验知识,加强特征表达能力;所述多阶段特征金字塔由多个特征金字塔串联形成,将前一阶段生成的特征金字塔的输出作为下一阶段特征金字塔的输入,前面的特征金字塔表达浅层特征,后续的特征金字塔为深层特征,每个特征金字塔均包含丰富的多尺度信息;
抗遮挡模块,用于通过注意力机制学习前景目标的掩码,并与候选框特征进行融合,抑制背景的干扰,得抗遮挡特征;
死鱼目标识别模块,用于以候选框特征为初始起点,结合抗遮挡特征和全连接层,回归表征死鱼位置的旋转矩形框,并进行死鱼类别分类,完成死鱼目标识别。
2.根据权利要求1所述的抗遮挡与多尺度死鱼识别系统,其特征在于:所述死鱼识别数据集模块,包括死鱼类、活鱼类、背景类三大类别数据,并分为训练集、验证集和测试集三个数据集;所述的图像特征提取模块,还用于设计对比度受限的自适应直方图均衡算法进行图像预处理,以改善图像细节信息和局部对比度;所述图像特征提取模块包括ResNet、VGG、MobileNets或Efficient通用系列网络,按系统处理实时性需求进行选择。
3.根据权利要求1所述的抗遮挡与多尺度死鱼识别系统,其特征在于:所述多尺度特征加强模块,包括多阶段特征金字塔、跨阶段连接单元及多尺度特征生成三个部分,所述的多阶段特征金字塔生成方式为首先将图像特征提取模块的输出特征通过一个侧向连接的1×1卷积,通道数降维至256,并用双线性插值将高层低分辨率特征进行2倍上采样;然后将上采样后的特征与降低通道后的特征进行逐像素相加;最后使用3×3卷积融合相加后的特征图,获得当前的加强特征,重复上述步骤3次即生成单个由4层特征组成的特征金字塔。
4.根据权利要求3所述的抗遮挡与多尺度死鱼识别系统,其特征在于:
所述的多尺度特征生成过程为,假设n个多阶段特征金字塔表示为{P1,P2,…,Pn},每个金字塔由4层特征{C1,C2,C3,C4}组成,其步长分别为4,8,16,32,将各金字塔相同步长的特征层进行逐像素累加,输出多尺度特征{F1,F2,F3,F4};其中,n设置为2或设置更大的n值。
5.根据权利要求4所述的抗遮挡与多尺度死鱼识别系统,其特征在于:所述生成候选框包括RPN网络和自适应ROIAlign算法单元;首先将RPN网络输出的候选框的置信度进行排序,进而去除置信度低的框,然后再进行后续NMS操作,以提升算法后处理速度;自适应ROIAlign算法单元,用于自适应池化不同特征层的特征并进行融合,先将生成的所有候选框均映射到所述的多尺度特征{F1,F2,F3,F4},并进行池化核为7×7的ROIAlign操作,然后将生成的特征进行映射后完成融合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司七五0试验场,未经中国船舶重工集团公司七五0试验场许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110653176.7/1.html,转载请声明来源钻瓜专利网。