[发明专利]一种基于卷积神经网络的目标检测方法和系统有效
| 申请号: | 201811347546.9 | 申请日: | 2018-11-13 |
| 公开(公告)号: | CN109583483B | 公开(公告)日: | 2020-12-11 |
| 发明(设计)人: | 唐乾坤;胡瑜;金贝贝;曾一鸣;刘世策;叶靖 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
| 地址: | 100080 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 卷积 神经网络 目标 检测 方法 系统 | ||
本发明涉及一种基于卷积神经网络的目标检测方法和系统,包括:使用多种尺度的卷积核分别提取待测图片的卷积特征图;使用全连接层调节卷积特征图每一个空间位置的特征向量,得到第一特征图,将其拼接得到拼接特征图,使用全连接层调节拼接特征图每个通道的特征信息,得到第二特征图;为第二特征图的每个空间位置上设定不同尺度和长宽比的锚点框,锚点框的坐标和大小是相对于待测图片的坐标系;将每个锚点框投影到第二特征图上,使用区域特征提取操作提取投影之后锚点框内部的特征,并将框选有物体的锚点框作为目标候选框;使用目标识别网络对目标候选框中的物体进行分类以及回归目标候选框的准确位置和大小。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种增强的目标候选区域生成方法与装置及目标检测方法。
背景技术
目标检测是计算机视觉领域的基础课题之一,随着深度卷积神经网络的发展,目标检测的性能也获得了很大的改善。在目前基于卷积神经网络的目标检测方法中最常用的是基于两阶段的目标检测流程,该流程首先使用目标候选生成网络生成候选框(proposals),然后使用识别网络对候选框(proposals)进行分类和精调得到最后的边界框。
在基于两阶段的检测流程中,生成候选框是最重要的一步。现已有两类目标候选框的生成方法:一类是使用传统的手工特征的方法,另一类是基于深度学习的候选框生成技术。前者使用超像素或者物体的边缘信息等得到候选框;后者使用全卷积网络借助于锚点框(anchorbox,一系列预先设定位置、尺度和长宽比的矩形框,下同)来同时预测候选框的位置和判断候选框是否包含物体。
基于深度学习的候选框生成技术虽然获取的候选框的质量相比于基于传统手工特征的方法得到结果要好,但是基于深度学习的目标候选框生成技术生成的候选框中包含大量的背景而不是包含着真正的物体。最终使得第二阶段的识别模型得到的边界框不能获得更高的定位准确度,限制了目标检测性能的改善。基于深度学习的生成方法的主要局限在于使用单一尺度的卷积核来为不同尺度的物体提取特征,同时特征图同一位置上不同尺度的锚点框使用了相同的特征,使得最终的结果是子优化的。
发明内容
针对基于深度学习的候选框生成技术在生成候选框的过程中使用单一尺度的卷积核提取特征以及不同尺度锚点框共用相同特征的局限性,导致目标检测不能获得更高定位精度的情况,本发明提出了一种基于卷积神经网络的目标检测方法,包括:
步骤1、使用多种尺度的卷积核分别提取待测图片的卷积特征图;
步骤2、使用全连接层调节该卷积特征图每一个空间位置的特征向量,得到第一特征图;
步骤3、拼接该第一特征图,得到拼接特征图,使用该全连接层调节该拼接特征图每个通道的特征信息,得到第二特征图;
步骤4、为该第二特征图的每个空间位置上设定不同尺度和长宽比的锚点框,该锚点框的坐标和大小是相对于该待测图片的坐标系;
步骤5、将每个锚点框投影到该第二特征图上,使用区域特征提取操作提取投影之后锚点框内部的特征,并根据该锚点框内部的特征得到该锚点框中包含物体的概率值,并根据该概率值从所有该锚点框中挑选目标候选框;
步骤6、使用目标识别网络对目标候选框中的物体进行分类以及回归目标候选框的准确位置和大小,根据该准确位置和大小确定物体的边界框,将分类结果和该边界框作为目标检测结果输出。
该基于卷积神经网络的目标检测方法,其中该步骤1具体为使用k个不同卷积核的卷积操作并行提取特征。
该基于卷积神经网络的目标检测方法,其中该步骤2具体通过下式调节该卷积特征图每一个空间位置的特征向量:
ωij=F(dij)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811347546.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频加密系统
- 下一篇:一种通用PSK调制解调系统





