[发明专利]基于跨尺度特征融合的深度卷积神经网络目标检测方法在审
| 申请号: | 201811368196.4 | 申请日: | 2018-11-16 |
| 公开(公告)号: | CN109522958A | 公开(公告)日: | 2019-03-26 |
| 发明(设计)人: | 胡海峰;黄福强 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
| 地址: | 510260 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 卷积神经网络 跨尺度 目标检测 特征图 分辨率 检测器 特征融合模块 输入图片 特征融合 分类器 金字塔 背景干扰 复杂背景 公开目标 检测结果 检测数据 物体类别 有效抑制 边界框 辨别性 鲁棒性 前馈 标注 输出 分类 检测 融合 表现 图片 | ||
1.一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:包括以下步骤:
S1:将待测图片输入到特征提取网络,输出不同分辨率的特征图;
S2:将特征提取网络输出的两张特征图输入到跨尺度特征融合模块进行特征融合;
S3:对特征融合后的特征图进行噪声抑制、降维、抗混叠处理得到新的特征图,并将处理后的特征图输入至跨尺度特征融合模块中与S1中的另一张输出特征图进行特征融合;
S4:将S3得到的特征融合后的特征图进行检测、分类、计算误差并对检测模型进行训练以及参数更新,并利用训练好的模型进行目标检测。
2.根据权利要求1所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:从特征提取网络不同的位置输出具有不同分辨率的特征图,靠近输入端的特征图的分辨率大于靠近输出端的特征图的分辨率,即越靠近输入端其分辨率越大。
3.根据权利要求1所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:所述特征提取网络基于ResNet网络,特征提取网络包括一系列残差连接块。
4.根据权利要求3所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:所述特征提取网络的残差连接块串联。
5.根据权利要求1所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:步骤S2中特征融合的具体步骤为:
S21:将分辨率大小相邻的两张特征图输入到跨尺度特征融合模块中,其中分辨率小的为特征图A,分辨率大的为特征图B;
S22:令特征图A经过一个空洞卷积层的处理,使得每个神经元的感受野增大,得到特征图A1;
S23:将特征图A1经过一个反卷积层得到特征图A2,使得特征图A2的分辨率扩大到与特征图B分辨率相同。
6.根据权利要求1所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:步骤S3的具体过程为:
S31:将特征图A2中的背景噪声和干扰信息进行抑制后输出特征图A3;
S32:将A3和B沿通道维度进行串联,再经过后续降维,抗混叠处理,得到特征图A3和B跨尺度融合后的特征图A4;
S33:将跨尺度融合后的特征图A4作为S2的输入特征图B,并把S1中的下一个相邻输出特征图作为S2的输入A,直到所有特征图完成特征融合。
7.根据权利要求1所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:步骤S4的具体过程为:
S41:将S33中特征融合后的特征图逐个输入到检测模型中,并将它们的结果整合到一起作为最终输出的检测结果,计算出检测模型的类别误差以及坐标值误差;
S42:将分类误差以及坐标值误差的加权相加得到检测模型的总体误差;
S43:计算总体误差对检测模型参数的梯度值,并使用小批量梯度下降算法mini-batch对检测模型参数进行更新。
8.根据权利要求7所述的一种基于跨尺度特征融合的深度卷积神经网络目标检测方法,其特征在于:检测模型的类别误差采用Softmax进行计算,检测器的坐标值误差采用平滑L1损失函数SmoothL1函数计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811368196.4/1.html,转载请声明来源钻瓜专利网。





