[发明专利]基于跨尺度特征融合的深度卷积神经网络目标检测方法在审

专利信息
申请号: 201811368196.4 申请日: 2018-11-16
公开(公告)号: CN109522958A 公开(公告)日: 2019-03-26
发明(设计)人: 胡海峰;黄福强 申请(专利权)人: 中山大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510260 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 卷积神经网络 跨尺度 目标检测 特征图 分辨率 检测器 特征融合模块 输入图片 特征融合 分类器 金字塔 背景干扰 复杂背景 公开目标 检测结果 检测数据 物体类别 有效抑制 边界框 辨别性 鲁棒性 前馈 标注 输出 分类 检测 融合 表现 图片
【说明书】:

发明公开一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,使用公开目标检测数据集上大量标注了物体类别及边界框信息的图片训练得到一个由三部分(深度卷积神经网络,跨尺度特征融合模块,检测器和分类器)组成的目标检测模型,并实现对任意分辨率输入图片进行处理。该发明首先由深度卷积神经网络的前馈过程生成一系列具有不同分辨率的特征图,然后跨尺度特征融合模块对不同分辨率的特征图进行融合,生成一个更具鲁棒性和辨别性的特征金字塔,最后由检测器对特征金字塔进行检测并由分类器对输出的检测结果进行分类。本发明生成的特征图能有效抑制背景干扰,对有复杂背景信息的输入图片具有很好的表现。

技术领域

本发明涉及人工智能领域,更具体地,涉及一种基于跨尺度特征融合的深度卷积神经网络目标检测方法。

背景技术

作为计算机视觉中的一个基本任务,目标检测任务一般可以分解为两个子任务。首先,模型需要定位图片中目标的位置,这要求模型具有辨别前景和背景信息的能力。其次,模型需要对定位后的目标进行分类。如果要同时满足上述两种要求,则要求模型提取到对类内物体的外貌差异以及类间物体的尺度差异都具有很强的鲁棒性的特征。

近年来基于深度卷积神经网络的模型不断地在计算机视觉领域取得突破,尤其是在图像分类任务上,深度卷积神经网络模型甚至超过了人类的表现,而这很大一部分归功于深度卷积神经网络能够提取到具有鲁棒性的图像非线性特征。而在目标检测领域,Kaiming He于2014年首次提出了基于深度卷积神经网络的目标检测模型R-CNN。该模型把目标检测任务分为两个阶段进行,第一阶段是生成一系列具有粗略位置信息的候选框,第二阶段对第一阶段生成的候选框位置进行微调,使得它更接近于真实值,并对候选框中的包含的物体进行分类。R-CNN模型的有效性奠定了目标检测任务的二阶段处理框架,随后提出的大量的改进算法都是在此基础上进行改进。而为了更好的检测不同尺度的目标,SSD(Single Shot Multibox Detector)模型尝试利用卷积神经网络中不同分辨率的特征图进行预测,但是由于低层特征缺乏足够的语义信息,因此对小尺度目标的检测性能相对较弱。

发明内容

本发明为克服上述现有技术所述的对小尺度目标的检测性能相对较弱的缺陷,提供一种基于跨尺度特征融合的深度卷积神经网络目标检测方法。

本发明旨在至少在一定程度上解决上述技术问题。

本发明的首要目的是更有效地利用卷积神经网络中各层的特征。

为解决上述技术问题,本发明的技术方案如下:一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,包括以下步骤:

S1:将待测图片输入到特征提取网络,输出不同分辨率的特征图;

S2:将特征提取网络输出的特征图输入到跨尺度特征融合模块进行特征融合;

S3:对特征融合后的特征图进行噪声抑制、降维、抗混叠处理得到新的特征图,并将处理后的特征图输入至跨尺度特征融合模块中与S1中的另一张输出特征图进行特征融合;

S4:将S3得到的特征融合后的特征图进行检测、分类、计算误差并对模型参数进行更新,并利用训练好的模型进行目标检测。

本发明首先由深度卷积神经网络的前馈过程生成一系列具有不同分辨率的特征图,然后跨尺度特征融合模块对不同分辨率的特征图进行融合,生成一个更具鲁棒性和辨别性的特征金字塔,最后由检测器对特征金字塔进行检测并由分类器对输出的检测结果进行分类。

优选地,从特征提取网络的不同位置输出具有不同分辨率的特征图,靠近输入端的特征图分辨率大于靠近输出端的特征图分辨率,即越靠近输入端其分辨率呈逐渐变大。

优选地,特征提取网络基于ResNet网络,并且特征提取网络由串联的残差连接块组成,它能有效缓解随着网络深度增加而带来的网络性能退化问题,并得到一系列不同分辨率的特征图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811368196.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top