[发明专利]基于多尺度和多层特征融合的快速目标检测方法有效
| 申请号: | 201811542026.3 | 申请日: | 2018-12-17 |
| 公开(公告)号: | CN109886066B | 公开(公告)日: | 2023-05-09 |
| 发明(设计)人: | 刘亚洲;曹森 | 申请(专利权)人: | 南京理工大学 |
| 主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/25;G06V10/40;G06V10/46;G06V10/82;G06N3/084;G06N3/08;G06N3/0464 |
| 代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
| 地址: | 210094 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 尺度 多层 特征 融合 快速 目标 检测 方法 | ||
1.一种基于多尺度和特征融合的快速目标检测方法,其特征在于,包括以下步骤:
1)设计卷积神经网络的主要模块Front module和Tinier module;
2)由基础模块构建完整的卷积神经网络结构;
3)将低层次的特征图进行上采样,得到与上一层同样尺度的特征图;
4)将不同层次的特征图进行融合操作,得到新的特征图;
5)预处理训练集,并初始化卷积神经网络训练参数;
6)训练神经网络,即通过不断迭代前向传播过程、反向传播过程优化网络的参数;包括以下具体步骤:
61)卷积神经网络进行前向传播,方法如下:
其中,表示网络的m层和m-1层之间的权重矩阵,表示偏移参数,p(m)表示m层的节点数目,表示非线性激励函数,通常使用tanh、sigmoid或者ReLU函数;
62)根据每个图片的真实标签信息和前向传播得到到预测信息,计算网络的损失函数;
63)执行反向传播过程,计算损失函数关于某一节点的偏导数,使用梯度下降法更新网络的权重参数;方法如下:
其中m表示层数,i表示神经元在层中的序号,j表示一个神经元输入的序号,α表示学习率;
64)重复步骤61)~步骤63)直至损失函数小于阈值或者达到最大迭代次数;
65)保存训练好的网络模型;
7)使用训练好的网络模型对测试图像中的目标进行检测。
2.根据权利要求1所述的方法,其特征在于,所述步骤1)包括以下具体步骤:
11)构建前置模块Front module;
12)构建主体模块Tinier module;
步骤11)包括以下具体步骤:
111)使用3层卷积层和1层最大池化层组成Front module;
112)在每个卷积层之后依次添加权重归一化层和激活函数层;
113)3层卷积层位置在前面,1层最大池化层在最后;
114)初始化卷积层和池化层参数,三层卷积层卷积核大小为3×3,卷积核的个数分别为64,64,128,最大池化层大小为2×2,步长为2;
步骤12)包括以下具体步骤:
121)使用4层卷积层组成Tinier module;
122)将第一层和第三层卷积层的卷积核大小设置为1×1;
123)将第二层和第四层的卷积层的卷积核大小设置为3×3,提取图像中的抽象特征。
3.根据权利要求1所述的方法,其特征在于,所述步骤2)包括以下具体步骤:
21)使用1个Front module,5个Tinier module和2个Detector layer组成完整的卷积神经网络结构;
22)调整每个模块的位置,Front module在最前面,Tinier module在中间,Detectorlayer在最后,前三个Tinier module之后加入最大池化层;
23)设定Detector Layer的主要参数。
4.根据权利要求3所述的方法,其特征在于,所述步骤23)包括以下具体步骤:
231)Detector layer使用1×1的卷积层;
232)根据数据集中目标的类别总数确定1×1的卷积层的卷积核个数,方法如下:
Noutput=Nbox+(5+Nboxclasses)
其中Noutput是最后一层卷积核个数,Nbox是特征图中每一个点负责检测物体的个数,默认值为3,Nboxclasses是类别数;使用KITTI数据集作为训练集,包含3个物体类别,分别是汽车,行人,自行车,Nboxclasses设置为3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811542026.3/1.html,转载请声明来源钻瓜专利网。





