[发明专利]一种基于改进深度残差网络的弱监督目标检测方法有效
| 申请号: | 202010300251.7 | 申请日: | 2020-04-16 | 
| 公开(公告)号: | CN111523585B | 公开(公告)日: | 2022-05-31 | 
| 发明(设计)人: | 纪荣嵘;沈云航 | 申请(专利权)人: | 厦门大学 | 
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 | 
| 代理公司: | 厦门市新华专利商标代理有限公司 35203 | 代理人: | 罗恒兰 | 
| 地址: | 361000 福建*** | 国省代码: | 福建;35 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 改进 深度 网络 监督 目标 检测 方法 | ||
本发明涉及一种基于改进深度残差网络的弱监督目标检测方法,其在构建网络模型时,采用深度残差网络作为主干网络,并将候选区域池化层和冗余自适应脖子网络结合到主干网络和弱监督检测头部网络之间,有效弥补了已有的深度残差网络应用于弱监督目标检测时的缺点,大大提升了弱监督目标检测的性能。
技术领域
本发明涉及计算机视觉领域,具体涉及一种基于改进深度残差网络的弱监督目标检测方法。
背景技术
目标检测是机器视觉的基本问题,在视频监控、无人驾驶等场景都有广泛应用。随着深度学习的兴起,近年来涌现了大量优秀的目标检测模型。然而,基于强监督学习的目标检测结果严重依赖于目标标注的准确性,而目标标注的结果很容易受到主观判断的影响。
随着深度学习的不断发展,目标标注的成本变得越来越高。训练一个高准确率的检测模型需要大量的以包围框形式精细标注的图片数据作为模型监督条件,需要花费大量的人力物力。如何利用低成本的图像标注取得良好的检测结果成为了当下研究的热点,因此研究者开始研究基于弱监督学习的目标检测算法。同时,我们可以从互联网轻松获取海量粗标注的图片,如利用Flickr的标签。因此,研究如何在弱监督条件下,即仅提供粗略图片类别标注,训练目标检测模型,具有重要的意义。已有学者探索了基于多示例学习构建弱监督条件下的目标检测模型学习方法,但是模型的精确度仍然难以令人满意。与强监督需要大量人工标注不同,弱监督只需要提供图像级别的标签,即指出图像中是否包含某类目标,从而实现目标检测。
给定一张图像和对应的候选区域,大多数弱监督目标检测使用候选区域特征池化层显式地从主干网络的图像特征图中截取出候选区域的特征。然后使用特定任务的弱监督检测头部网络来进行目标定位和候选区域特征学习。然而,目前大多数方法都是使用普通的非残差结构的卷积神经网络(如VGG、AlexNet网络等)作为主干网络。但是,非残差卷积神经网络的层数有限,难以扩展到更深的神经网络模型。例如,ALexNet只有8层,VGG最深只有19层。而深度残差网络(如ResNet,DenseNet网络等)则可以轻松达到上百层,甚至上千层。例如ResNet1202的深度达到1202层。总所周知,在计算机视觉不同的领域里,更深的卷积神经网络往往可以带来更好的特征。例如图像分类和目标检测里,ResNet152的性能远远优于VGG和AlexNet。
目前,基于深度残差网络的弱监督目标检测的研究还是一个未探索的领域。事实上,直接使用深度残差网络(如ResNet,DenseNet网络)作为主干部分会大大降低弱监督目标检测的性能。这也是大多数弱监督目标检测方法不使用深度残差网络的主要原因。因此,在弱监督目标检测领域里,如何充分利用残差网络结构以提升性能是一个迫切亟需研究的问题。
发明内容
针对现有技术存在的问题,本发明的目的在于提供一种基于改进深度残差网络的弱监督目标检测方法,其可以有效提高弱监督目标检测的性能。
为实现上述目的,本发明采用的技术方案是:
一种基于改进深度残差网络的弱监督目标检测方法,其包括以下步骤:
(1)构建网络模型;
选择任意深度残差网络作为主干网络,在深度残差网络和弱监督头部网络之间加入候选区域池化层和冗余自适应脖子网络;其中,候选区域池化层的输入是深度残差网络的图像特征图,输出是候选区域特征图;冗余自适应脖子网络是两层全连接层,第一层全连接层输入是候选区域特征池化层的候选区域特征图;第二层全连接层的输入是第一层全连接层的输出,而弱监督检测头部的输入是第二次全连接层的输出;
(2)采用弱监督数据集对重构后的网络模型进行训练;
(3)给定任意图像,将其输入训练后的网络模型,网络模型输出检测结果。
所述步骤(1)中,在深度残差网络和弱监督头部网络之间加入候选区域特征池化层和冗余自适应脖子网络之前,对深度残差网络的进行重构:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010300251.7/2.html,转载请声明来源钻瓜专利网。





