[发明专利]一种基于级联的物体检测方法及系统、存储介质及终端有效
申请号: | 201810300288.2 | 申请日: | 2018-04-04 |
公开(公告)号: | CN110348453B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 汪宏;叶浩;郑莹斌;邵蔚元;王丽 | 申请(专利权)人: | 中国科学院上海高等研究院;上海市信息技术研究中心 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/40;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
地址: | 201210 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 级联 物体 检测 方法 系统 存储 介质 终端 | ||
本发明提供一种基于级联的物体检测方法及系统、存储介质及终端,包括以下步骤:基于特征提取网络来获取图像的第一图像特征;基于候选框生成网络获取置信度大于预设阈值的置信候选框及其对应的第一特征向量和一次调整后的位置;基于精调网络获取所述置信候选框二次调整后的位置和置信度。本发明的基于级联的物体检测方法及系统、存储介质及终端将级联网络的思想与检测网络相结合,对物体候选框逐步进行调整,不同阶段使用不同的网络进行优化,使得物体的位置和分类信息同时得到提升,能够同时兼顾物体检测速度和精度。
技术领域
本发明涉及物体检测的技术领域,特别是涉及一种基于级联的物体检测方法及系统、存储介质及终端。
背景技术
通用物体检测是日常生活中广泛应用的一门技术。级联检测算法和DPM(deformable part models,可变性的组件模型)算法是两种较常用的物体检测方法。级联检测算法由一系列的弱分类器组成,通过级联方式在前期筛除大量非目标候选框,使得检测速度有了很大的提升。后来提出的一些方法均扩展了这种级联的流程并取得了较好的成绩。另一方面,DPM检测器通过检索物体的部分信息和空间组成信息成功地在物体检测上取得了一些进步。
近年来,卷积神经网络在通用物体检测上取得了突破性的进展,获得了很好的成效。如Faster RCNN,YOLO,SSD等网络模型,其在网络特征图上直接或间接生成物体候选框并其进行过滤、纠正等操作,从而得到最终的检测结果。
然而,现有的通用物体检测算法均无法同时兼顾物体检测速度和精度,无法满足不同情形下的物体检测需求。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于级联的物体检测方法及系统、存储介质及终端,将级联网络的思想与检测网络相结合,对物体候选框逐步进行调整,不同阶段使用不同的网络进行优化,使得物体的位置和分类信息同时得到提升,能够同时兼顾物体检测速度和精度。
为实现上述目的及其他相关目的,本发明提供一种基于级联的物体检测方法,包括以下步骤:基于特征提取网络来获取图像的第一图像特征;基于候选框生成网络对所述第一图像特征进行精简获取第二图像特征,并将所述第二图像特征划分为多个网格,在每个网格上生成固定数目和尺寸的候选框;基于RoI池化层提取每个候选框的图像特征,基于若干全连接层获取置信度大于预设阈值的置信候选框及其对应的第一特征向量和一次调整后的位置;基于精调网络和所述第一图像特征获取第三图像特征;根据所述置信候选框的位置信息和所述第三图像特征基于RoI池化层获取所述置信候选框的图像特征;对于每个所述置信候选框,基于所述置信候选框的图像特征和若干全连接层生成对应的第二特征向量,并与所述第一特征向量拼接为第三特征向量;基于所述第三特征向量、所述一次调整后的位置和全连接层获取所述置信候选框二次调整后的位置和置信度。
于本发明一实施例中,所述特征提取网络采用特征融合算法获取所述第一图像特征。
于本发明一实施例中,所述特征提取网络采用VGG16网络的卷积层部分获取第一图像特征;所述候选框生成网络采用带有4个过滤器的卷积层获取第二图像特征;所述精调网络采用带64个过滤器的卷积层获取第三图像特征。
于本发明一实施例中,基于若干全连接层获取信度大于预设阈值的置信候选框及其对应的第一特征向量时,还包括对所述置信度大于预设阈值的置信候选框进行非最大值抑制操作,获取预设数量个置信度大于预设阈值的置信候选框。
于本发明一实施例中,训练所述候选框生成网络时,将候选框和真实值的IoU大于0.5的候选框作为正样本,小于0.3的候选框作为负样本,仅基于所述正样本和所述负样本进行模型训练时的参数更新;训练所述精调网络时,将候选框与真实值IoU大于0.45的候选框作为正样本,介于0.1到0.3之间的候选框作为负样本,仅基于所述正样本和所述负样本进行模型训练时的参数更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海高等研究院;上海市信息技术研究中心,未经中国科学院上海高等研究院;上海市信息技术研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810300288.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像二值化处理方法及其系统
- 下一篇:匹配局部图像特征描述符