[发明专利]基于深度神经网络的对象性增强目标检测方法有效
申请号: | 201911143997.5 | 申请日: | 2019-11-20 |
公开(公告)号: | CN111046917B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 韩静;张毅;柏连发;王灿龙;陈霄宇;黄永豪;王其鑫 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06K9/62;G06V10/80 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 封睿 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 对象 增强 目标 检测 方法 | ||
本发明公开了一种基于深度神经网络的对象性增强目标检测方法,基于单阶段目标检测网络,在浅层网络使用多尺度融合模块增强特征多尺度信息,并在单阶段目标检测网络中加入对象性估计模块为目标检测的所有预测特征提供对象性先验知识,构建基于深度神经网络的目标检测模型;将训练图像数据输入目标检测模型,利用反向传播算法更新目标检测模型网络参数,直至损失函数值变化量小于设定阈值,得到训练好的目标检测模型;将测试图像数据输入训练好的目标检测模型,得到目标检测结果。本发明加入对象性估计模块,使用对象分布概率图来提高单阶段目标检测的精度;加入多尺度融合模块,使得单阶段目标检测算法对目标的尺度变化更加鲁棒。
技术领域
本发明属于计算机视觉领域,具体涉及一种基于深度神经网络的对象性增强目标检测方法。
背景技术
目标检测是计算机视觉的基础问题,应用广泛。现有的目标检测算法主要划分为两大类,一个是Faster R-CNN系列为代表的两阶段检测算法,另一个则是以YOLO和SSD为代表的单阶段检测算法。其中,两阶段检测器的第一个阶段是基于区域提议策略生成目标候选区域,第二个阶段就是将特征放入分类器并修正位置。区域提议策略在提升检测器性能的同时也牺牲了检测的速度,导致双阶段检测器往往很难达到检测的实时性。单阶段目标检测算法,没有区域建议的过程,直接对全图的密集候选区域进行预测,达到了检测精度和检测效率之间的平衡。由于单阶段检测算法没有候选区域提议策略,使用默认设置的候选区域数量极大,这给预测器带来了巨大的压力,同时单阶段检测器往往采用比较简单的预测器以保证检测速度,这也从根本上限制单阶段检测器的预测效果。
发明内容
本发明的目的在于提出了一种基于深度神经网络的对象性增强目标检测方法。
实现本发明目的的技术方案为:一种基于深度神经网络的对象性增强目标检测方法,其特征在于,包括如下步骤:
步骤1、基于单阶段目标检测网络,在浅层网络使用多尺度融合模块增强特征多尺度信息,并在单阶段目标检测网络中加入对象性估计模块为目标检测的所有预测特征提供对象性先验知识,构建基于深度神经网络的目标检测模型;
步骤2、将训练图像数据输入目标检测模型,利用反向传播算法更新目标检测模型网络参数,直至损失函数值变化量小于设定阈值,得到训练好的目标检测模型;
步骤3、将测试图像数据输入训练好的目标检测模型,得到目标检测结果。
步骤1中,使用SSD作为单阶段目标检测网络,将VGG16作为骨干网络提取特征,将VGG16的两个全连接层改成卷积层,去掉分类层和最后一个全连接层,并在此网络后面增加了8个局部卷积层;
使用多尺度融合模块来增强VGG16中conv4_3的输出特征,将增强后的特征输入到对象性估计模块与SSD的fc7层;
利用对象性估计模块使用语义分割网络SE-WResNetV2直接对VGG16的conv4_3层增强特征图进行对象性分布预测,对预测输出值使用Sigmoid激活函数映射到[0,1],获得对象分布概率图;将对象分布概率图插值到SSD每个预测尺度,并用对象分布概率图乘以与之对应尺寸的预测特征图,为SSD的预测特征进行对象性的打分。
步骤2中,损失函数定义如下:
Loss=lossdet+lossoe (1)
其中,lossdet表示SSD的目标检测预测结果与目标检测地面实况之间的误差,lossoe表示对象性分布的预测结果与对象性分布的地面实况之间的误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911143997.5/2.html,转载请声明来源钻瓜专利网。