[发明专利]一种基于密集连接特征金字塔网络的目标检测方法有效
申请号: | 201811310528.3 | 申请日: | 2018-11-06 |
公开(公告)号: | CN109614985B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 秦华标;杨光俊 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/776;G06V10/774;G06V10/764;G06V10/766;G06N3/0464;G06N3/045;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 密集 连接 特征 金字塔 网络 目标 检测 方法 | ||
本发明公开了一种基于密集连接特征金字塔网络的目标检测方法,涉及图像处理和计算机视觉技术。该方法包括:收集标注目标边界框和类别信息的图像数据集;构造含有能学习特征通道间依赖关系的Squeeze‑Excitation结构的密集连接特征金字塔网络作为特征提取主干网络;交替训练RPN子网和R‑FCN子网得到目标检测模型;利用该模型检测图像中特定的目标。通过在特征提取主干网络中引入Squeeze‑Excitation结构和密集连接结构,增强模型的表征能力,特征金字塔结构增强模型对不同尺寸目标的适应性,采用R‑FCN检测头最大程度地实现整个网络模型计算的共享,节省计算资源,提高整个目标检测模型的性能。
技术领域
本发明涉及图像处理和计算机视觉技术,具体是涉及一种基于密集连接特征金字塔网络的目标检测方法。
背景技术
视觉要解决的问题可归结为“What is Where”,即“什么东西在什么地方”。传统的图像分类解决的主要是“What”问题,即判断一幅图像包含的是哪类物体。但随着技术的发展和应用需求的增长,我们不仅关注对图像的简单分类,而且希望能够准确获得图像中存在的感兴趣目标及其位置(一般通过目标边界框给出),这正是目标检测所要解决的问题。目标检测具有巨大的实用价值和应用前景,同时,目标检测也是整个计算机视觉的研究基石,是解决跟踪、分割、场景理解等其他高层视觉处理和分析任务的基础。因此,在计算机视觉领域中,目标检测是一个非常重要的研究领域并且受到了广泛地关注。
近十几年来,已有大量的学者对目标检测算法进行了深入地研究。目标检测技术在流程上大致分为三个步骤:区域建议(Region proposal)、特征表示(Featurerepresentation)和区域分类(Region classification)。首先对图像中可能的目标位置提出建议,也就是提出一些可能含有目标的候选区域。然后采用合适的特征模型对候选区域进行特征表示。最后借助分类器判断各个区域中是否含有特定类型的目标,并且通过一些后处理操作,得到最终的目标边界框。从历史发展的角度来看,目标检测算法的研究大致可以分为两个阶段:基于传统手工特征+分类器方式的研究和基于深度学习尤其是卷积神经网络的端到端方式的研究。
基于传统手工特征+分类器方式的目标检测算法通常先采取一定策略对输入图像中可能含有目标的位置进行区域建议。最常采用的策略就是利用不同尺寸和形状的滑动窗进行穷举搜索。滑动窗策略虽然简单但非常耗时,其它常用的策略有基于组合提名的策略和基于窗口打分的策略。这两种策略虽然相对滑动窗策略要更有效一些,但仍旧因为需要采样大量候选区域显得比较耗时。在通过区域建议策略得到大量候选区域后,需要对候选区域提取手工特征,例如SIFT特征,Haar特征,LBP特征,HOG特征等或是多种特征的组合,最后再利用SVM、Adaboost、随机森林等分类器对提取到的特征向量进行训练和分类从而得到最终的目标区域及类别。手工特征+分类器的方式因为在设计手工特征时需要丰富的专业知识并且花费大量的时间,而且由于加入了设计者的先验知识,通常只能针对特定任务或目标具有较好的效果,难以应用于更广泛的场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811310528.3/2.html,转载请声明来源钻瓜专利网。