[发明专利]一种基于逐级注意力机制的目标显著性检测方法在审
| 申请号: | 202111536499.4 | 申请日: | 2021-12-15 |
| 公开(公告)号: | CN114241218A | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 颜成钢;王灵波;孙垚棋;张继勇;李宗鹏 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 逐级 注意力 机制 目标 显著 检测 方法 | ||
本发明公开了一种基于逐级注意力机制的目标显著性检测方法。首先进行图像数据预处理,获得预处理后的图像训练集,然后构建目标显著性检测网络,最后通过图像训练集对目标显著性检测网络进行训练;本发明使得特征信息在空间注意力和通道注意力模块上都得以逐级递进,通道注意力模块组和空间注意力模块组使得网络能够提取更丰富的上下文信息,避免了语义杂糅,有效减少了分割噪声,尤其是假阴性噪声,目标显著性检测性能取得了显著提升。
技术领域
本发明属于计算机视觉领域,涉及显著目标检测、图像检测领域。具体涉及一种基于逐级注意力机制的目标显著性检测方法。
背景技术
随着深度学习、神经网络的飞速发展,计算机视觉领域实现了前所未有的跨越。目标检测作为计算机视觉领域一个经典大类,受到广泛的研究和探讨,在显著目标检测、行人重识别、图像数据评估等各个方向都取得了巨大进步。在生活中,面部扫描、车牌扫描、天网工程等都利用到了目标检测的相关技术。
人类视觉系统在面对自然场景时具有快速搜索和定位感兴趣目标的能力,这种视觉注意机制是人们日常生活中处理视觉信息的重要机制。随着互联网带来的大数据量的传播,如何从海量的图像和视频数据中快速地获取重要信息,已经成为计算机视觉领域一个关键的问题。通过在计算机视觉任务中引入这种视觉注意机制,即视觉显著性,可以为视觉信息处理任务带来一系列重大的帮助和改善。显著性物体检测的目的即是从图像中定位最有吸引力和视觉上独特的物体或区域,大量应用于图像分割、目标重定位、目标图像前景注释等领域。
U-Net是现在最为流行的图像分割网络,网络主要包括下采样和上采样两个部分,通过下采样对图片特征进行提取处理,而上采样则可以将特征信息进行还原,使得网络最后输出为一个完整图像。
现如今,注意力机制越来越受到广大学者关注,在现有神经网络中引入注意力机制可以聚焦主体信息,产生更具有分辨能力的特征信息,注意力模块的组合也能够使得网络获得注意力感知的能力,现有的注意力模块给各个网络模型性能带来了巨大的提升。
但是现存的基于注意力机制的显著性目标检测网络往往单一使用注意力模块,或者简单将注意力模块整合到编解码环节中,作为一个先验模块来提升自己网络性能,未能充分挖掘注意力模块对网络的性能提升和应用方式,错误的使用也常常导致语义信息的杂糅与噪声。
发明内容
针对现有技术存在的问题,本发明提供一种基于逐级注意力机制的目标显著性检测方法。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1、图像数据预处理,获得预处理后的图像训练集:
训练数据集采用DUTS图像数据集。对待训练数据集进行图像预处理,首先去除图像相关噪声干扰使数据更加精确,然后对去噪后的训练数据集进行扩增,获得预处理后的图像训练集。
步骤2、构建目标显著性检测网络:
目标显著性检测网络采用encoder-decoder(编码-解码)结构,编码部分采用ResNet34,在解码部分采用部分解码结构(Partial decoder)减少网络数据量,并且有两组不同的注意力模块(Channel Attention Module、Spatial Attention Module)与PDC逐次连接。。
步骤3、通过步骤1获得的图像训练集对目标显著性检测网络进行训练;
进一步的,步骤2所述的目标显著性检测网络具体结构如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111536499.4/2.html,转载请声明来源钻瓜专利网。





