[发明专利]一种基于边缘引导网络的伪装物体检测方法在审
申请号: | 202210193274.1 | 申请日: | 2022-02-28 |
公开(公告)号: | CN114581703A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 王硕;范登平;孙羽佳;陈程立诏;向天烛;张江 | 申请(专利权)人: | 北京师范大学;集智学园(北京)科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/80;G06V10/82;G06V10/44;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 边缘 引导 网络 伪装 物体 检测 方法 | ||
本发明公开了基于边缘引导网络的伪装物体检测方法,属于图像处理技术领域。大多数现有的深度学习方法往往无法准确地识别出伪装物体的完整且精细的结构。本发明创造性地提出了一种基于边缘引导网络的方法,其中边缘引导网络包括骨干模块、边缘感知模块、边缘引导特征模块、上下文聚合模块,增强了物体相关边缘语义信息的表征学习能力,输出完整且精细的伪装物体的掩模图与轮廓图。本发明在3个数据集上进行实验,4个评价指标均表明本发明超越当前所有最先进的伪装物体检测方法。
技术领域
本发明属于图像处理技术领域,特别涉及到一种基于边缘引导网络的伪装物体检测方法。
背景技术
当前景主体(相对凸出)试图“埋伏”在背景中来欺骗观察者视觉时,伪装场景即成立。在伪装场景中识别并分割伪装物体(前景主体),即伪装物体检测。由于伪装场景的普遍存在,伪装物体检测具有丰富的下游任务和应用场景,例如,医疗图像分割、工业缺陷检测、蝗虫入侵检测、创意图像合成等,引发了计算机视觉社区的广泛关注和研究兴趣。
早期的伪装物体检测方法依赖于颜色、纹理、动量和梯度等传统视觉特征,如果只提取使用一种视觉特征很难达到满意的效果,所以一些方法尝试使用上述视觉特征的组合来增强效果。然而,由于手工提取特征的局限性,这些方法往往在较为复杂的场景或真实应用中失效。
随着深度学习技术的兴起,基于卷积神经网络的方法从大量训练图像中自动学习到的深度特征比传统特征更全面、更通用、更有效。这些检测方法大致可分为三类:一类是仿生方法,它模仿自然界中捕食者的行为过程或人类视觉心理模式来设计网络;一类是设计有针对性的网络模块/架构,以有效探索可用于判别的伪装对象特征;一类是将一些辅助任务纳入联合学习/多任务学习框架,如分类任务、边缘提取、显著目标检测和伪装目标排序,这类方法可以从共享特征中挖掘出有价值的额外线索,从而显著增强伪装物体检测的特征表示。
在联合学习/多任务学习框架中,现有的采用边缘提取作为辅助任务的检测方法是一个基于图神经网络的交互图学习模型。这不可避免地增加了模型的复杂性,占用更多的计算资源。此外,尽管它引入了边界线索,但仍然丢失了一些与边界相关的细节,引入了一些明显的背景噪声,从而削弱了检测伪装物体的性能。
发明内容
本发明的目的是解决现有伪装物体检测方法中,伪装物体在与环境高度融合,尤其是边缘中断的情况下,只能给出粗糙或不完整的物体边界的问题。因此,本发明设计了一种基于边缘引导网络的伪装物体检测方法。
边缘引导网络(Boundary-Guided Network,BGNet)由骨干网络(BackboneNetwork, BN)、边缘感知模块(Edge-Aware Module,EAM)、边缘引导特征模块(Edge-guidance Feature Module,EFM)与上下文聚合模块(Context Aggregation Module,CAM)组成。
本发明方法包含如下步骤。
第1步,待检测图像的特征提取。利用骨干网络BN对待检测图像进行多层级特征提取,包括蕴含局部边缘细节的低层级特征与蕴含全局定位信息的高层级特征。
第2步,伪装物体边缘信息挖掘。利用边缘感知模块EAM,在提取的低层级特征和高层级特征中挖掘伪装物体相关的多层次边缘语义信息。
第3步,边缘信息引导特征提取。基于第2步挖掘的伪装物体的边缘语义信息,利用边缘引导特征模块EFM,提取骨干网络的特征,增强模型的边界特征的表示学习能力。
第4步,上下文信息汇聚并得到输出。利用CAM上下文聚合模块,聚合多层级特征与边缘信息,生成伪装物体的掩膜图与轮廓图。
本发明的优点和有益效果:本发明通过引入边缘线索,挖掘物体边缘语义信息,提升模型相关表征能力,输出更加准确的伪装物体预测。经实验,本发明在公开的3个数据集采用的4个评测指标上,均超越了目前最前沿的伪装目标检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学;集智学园(北京)科技有限公司,未经北京师范大学;集智学园(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210193274.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种摩托车用膜片碟簧式滑动离合器
- 下一篇:一种水位实时在线检测系统