[发明专利]一种结合定位信息和分类信息的目标检测方法有效
申请号: | 202010102354.2 | 申请日: | 2020-02-19 |
公开(公告)号: | CN111291820B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 丁鹏;张建廷;惠新成;朱刚;蒋保富;温菲霞 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214;G06N3/0464;G06N3/084 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李淑静 |
地址: | 210046 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 定位 信息 分类 目标 检测 方法 | ||
本发明提出一种结合定位信息和分类信息的目标检测方法。本发明在Faster R‑CNN的基础上,综合考虑了目标检测所需的分类信息和定位信息,可以在很大程度上提升检测的精度并保证检测的速度。首先,为了更加充分地提取分类特征并减少运行所需的参数以及降低网络过拟合的可能性,提出一种逆残差结构的全连接操作模块;其次,为了增强定位能力,提出一种结合定位信息和分类信息的操作模块。整个发明采用反向传播算法进行训练并在训练时引入“在线难例解析”技术以进一步提升精度。实验表明,本发明相较于Faster R‑CNN无论速度上还是精度上都具有极大的优势,极具应用价值。
技术领域
本发明涉及图像处理和人工智能技术领域,具体涉及一种基于深度卷积神经网络的双阶段目标检测方法。
背景技术
目标检测作为计算机视觉领域的重要组成部分,一直受到科研工作者极大的关注。近年来,随着人工智能特别是以深度卷积神经网络为代表的深度学习算法的进步,目标检测领域也取得了巨大的发展——基于深度卷积神经网络的目标检测器已经基本取代了传统机器学习时代以“Hog+SVM”模式进行目标检测的方法。相较于传统机器学习算法,深度卷积神经网络能够自主的提取多种目标更加本质的、具有代表性的特征,因而具有更好的精度和普适性。
从第一个基于深度卷积神经网络的目标检测器R-CNN开始,经过不断的演变和进化,目前,基于深度卷积神经网络的目标检测器主要可以分为两种:1、以Faster R-CNN为代表的双阶段目标检测器;2、以SSD、YOLO为代表的单阶段目标检测器。前者精度较高但是速度较慢,后者精度较低但是速度很快。在目标检测器发展的同时,卷积神经网络的结构也在不断的进步,从AlexNet、ZF-Net、VGG16-Net到GoogleNet、ResNet-50、ResNet-101、SeNet等等。随着深度卷积神经网络的结构从深度迈入超深度,基于FasterR-CNN检测器,采用全卷积的超深度网络如ResNet-50、ResNet-101等作为主体网络进行目标检测时,其在精度上的表现比较糟糕。这主要是由于网络太深导致输出特征层包含定位信息太少所导致的。因此,基于Faster R-CNN检测器,采用全卷积的超深度网络作为主体网络时,我们往往用第四段卷积层(Conv4)生成候选区域(Proposals)以及输入ROI-Pooling层进行后续的处理,第五段卷积层(Conv5)充当标准Faster R-CNN中全连接层(FC6和FC7层)的角色。虽然这种改变可以在一定程度上提升精度,但是检测的速度却是大大地被降低了。在Faster R-CNN的基础上,为了进一步提升精度,许多研究人员开展了多尺度特征结合的工作:通过结合包含边缘信息较多的浅层网络部分和包含分类信息较多的深层网络部分进行目标检测如Hyper-Net、FPN等,但是这些检测器在运行时需要很大的GPU显存且速度很慢。
因此,如何保证检测的速度并高效地引入定位信息以提升检测的精度是迫切需要解决的问题。
发明内容
发明目的:为了解决上述问题,本发明提出一种结合定位和分类信息的目标检测方法,在Faster R-CNN中增强分类信息、引入定位信息的同时保证检测的速度。
技术方案:一种结合定位和分类信息的目标检测方法,包括以下步骤:
(1)基于Faster R-CNN,采用ResNet-50作为网络结构,使用微调的方法构建基础的检测框架;
(2)将ResNet-50中第五段卷积层Conv5所有的卷积操作的步长改为1,并在3*3的卷积操作中引入空洞卷积,将修改后的ResNet-50作为主体网络,直接采用第五段卷积层Conv5生成候选区域Proposals以及输入后续的特征处理层;
(3)构建逆残差结构的全连接操作模块,并置于ROI-Pooling层之后用于提取特征;
(4)构建结合定位信息和分类信息的操作模块,并置于主体网络之后用于定位和分类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010102354.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置