[发明专利]基于深度神经网络的对象性增强目标检测方法有效
申请号: | 201911143997.5 | 申请日: | 2019-11-20 |
公开(公告)号: | CN111046917B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 韩静;张毅;柏连发;王灿龙;陈霄宇;黄永豪;王其鑫 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06K9/62;G06V10/80 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 封睿 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 对象 增强 目标 检测 方法 | ||
1.基于深度神经网络的对象性增强目标检测方法,其特征在于,包括如下步骤:
步骤1、基于单阶段目标检测网络,在浅层网络使用多尺度融合模块增强特征多尺度信息,并在单阶段目标检测网络中加入对象性估计模块为目标检测的所有预测特征提供对象性先验知识,构建基于深度神经网络的目标检测模型;
步骤2、将训练图像数据输入目标检测模型,利用反向传播算法更新目标检测模型网络参数,直至损失函数值变化量小于设定阈值,得到训练好的目标检测模型;
步骤3、将测试图像数据输入训练好的目标检测模型,得到目标检测结果;
其中,步骤1中,使用SSD作为单阶段目标检测网络,将VGG16作为骨干网络提取特征,将VGG16的两个全连接层改成卷积层,去掉分类层和最后一个全连接层,并在此网络后面增加了8个局部卷积层;
使用多尺度融合模块来增强VGG16中conv4_3的输出特征,将增强后的特征输入到对象性估计模块与SSD的fc7层;
利用对象性估计模块使用语义分割网络SE-WResNetV2直接对VGG16的conv4_3层增强特征图进行对象性分布预测,对预测输出值使用Sigmoid激活函数映射到[0,1],获得对象分布概率图;将对象分布概率图插值到SSD每个预测尺度,并用对象分布概率图乘以与之对应尺寸的预测特征图,为SSD的预测特征进行对象性的打分。
2.根据权利要求1所述的基于深度神经网络的对象性增强目标检测方法,其特征在于,步骤2中,损失函数定义如下:
Loss=lossdet+lossoe (1)
其中,lossdet表示SSD的目标检测预测结果与目标检测地面实况之间的误差,lossoe表示对象性分布的预测结果与对象性分布的地面实况之间的误差。
3.根据权利要求1所述的基于深度神经网络的对象性增强目标检测方法,其特征在于,对象性分布地面实况直接由每种类别目标的边界框标注数据生成;对于场景中的背景类,生成对象性分布地面实况时,将所有目标的边界框内像素值设置为0,其余为1;对于场景中出现的目标,生成对象性分布地面实况时其目标的边界框内像素值设置为1,其余为0,表示场景中目标的分布;对于未出现在场景中的目标类别,在设置对象性地面实况时将全图像素值直接设置为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911143997.5/1.html,转载请声明来源钻瓜专利网。