[发明专利]一种基于注意力融合的水下目标检测方法在审
申请号: | 202210410629.8 | 申请日: | 2022-04-19 |
公开(公告)号: | CN114782798A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 张亚新;赵志强;唐金龙;吕帅帅;潘勉;于海滨 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V20/05 | 分类号: | G06V20/05;G06V10/80;G06V10/25;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 融合 水下 目标 检测 方法 | ||
本发明公开了一种基于注意力融合的水下目标检测方法,包括以下步骤:步骤一,准备数据集。步骤二,构建基于注意力融合的目标检测网络。步骤三,获得通用场景下的特征提取网络。步骤四,构建损失函数,训练得到基于注意力融合的水下目标检测网络。本发明使用Vision‑Transformer模块提取输入图像的自注意力信息,并通过对输入图像分块,避免对完整图像计算自注意力,减少了计算量。使用PAFPN模块提取特征的空间注意力信息,并分层输出,将提取到的高级语义信息和低级细节信息进行融合。使用SE模块提取特征的通道注意力信息,进一步提升了模型的检测精度。
技术领域
本发明涉及计算机技术领域,尤其涉及计算机视觉、图像模式识别技术领域。
背景技术
目标检测技术是目前计算机视觉领域非常热门的基础研究方向,该技术能够准确地给出图像/视频中感兴趣的目标的类别和位置。作为计算机视觉领域的的基础研究方向,基于目标检测技术有很多重要的应用,例如工业生产线上瑕疵检测、水下鱼类养殖场捕捞、文字识别等。
申请号为202111127297.4的发明专利(大连理工大学专利中心),公布了一种基于特征融合及神经网络搜索的轻量型水下目标检测方法,该发明将陆上与水下检测网络特征进行融合,即相加操作,以实现利用陆上先验知识指导水下网络结构建设的目标。同时利用神经网络搜索算法,设计高效搜索空间,采用基于梯度的可微搜索策略,并构建水下超网络结构以及陆上镜像检测结构以直接建立水下降质因素、陆上先验信息与检测网络结构的联系。
现有技术存在以下不足之处:
1、现阶段,把特征相加的操作,即特征融合,属于提取空间注意力信息,而仅使用空间注意力信息是不完备的。
2、现阶段,使用Vision-Transformer提取图像的自注意力信息已被证明,性能优于卷积神经网络提取的空间注意力信息。
3、现阶段,基于卷积神经网络的深度学习模型只能用于图像领域,而Vision-Transformer为深度学习计算机视觉领域和自然语言处理领域的大一统提供了有效的标准框架。
发明内容
本发明旨在解决现有基于卷积神经网络的水下目标检测方法的不足,提供一种有监督学习的基于注意力融合的水下目标检测方法。改进基于通用目标检测先验信息的水下目标检测结构。
一种基于注意力融合的水下目标检测方法,步骤如下:
步骤一,准备数据集。
步骤二,构建基于注意力融合的目标检测网络。
步骤三,获得通用场景下的特征提取网络。
步骤四,构建损失函数,训练得到基于注意力融合的水下目标检测网络。
进一步的,步骤一具体方法如下:
在实际水下场景下拍摄含有感兴趣目标的图片/视频(拍摄的是视频,需要截取为图片),采用目标检测数据集标注软件为图片中出现的感兴趣目标做标注,获得水下目标检测数据集;从ImageNet官方网站下载数据集,以备模型预训练使用;
进一步的,步骤二具体方法如下:
所述的基于注意力融合的目标检测网络包括主干特征提取网络、PAFPN路径增强特征金字塔模块、区域推荐网络和检测头。
图片输入到目标检测网络中,通过主干特征提取网络提取自注意力信息,通过PAFPN路径增强特征金字塔模块提取空间注意力信息,通过检测头内部的SE模块(SqueezeExcitation Block)提取通道间注意力信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210410629.8/2.html,转载请声明来源钻瓜专利网。