[发明专利]基于多尺度感受野特征融合的深度神经网络目标检测方法有效
| 申请号: | 201910498679.4 | 申请日: | 2019-06-10 |
| 公开(公告)号: | CN110298266B | 公开(公告)日: | 2023-06-06 |
| 发明(设计)人: | 宋雅麟;庞彦伟 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06V20/60 | 分类号: | G06V20/60;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 尺度 感受 特征 融合 深度 神经网络 目标 检测 方法 | ||
1.一种基于多尺度感受野特征融合的深度神经网络目标检测方法,用于目标检测,包括下列步骤:
1)收集训练样本图片,要求图像包含RGB三通道,并附有物体检测框标注和每个物体的类别标注信息;
2)将收集到的图像数据集中的图像数据和标签数据通过预处理转为训练深度卷积神经网络所要求的格式;
3)图像集划分;将收集到的数据集划分为训练集,验证集和测试集,训练集用于训练深度卷积神经网络,验证集用于选择最优的训练模型,测试集为后续测试模型效果或在实际应用时使用;
4)设计基于多尺度感受野特征融合的深度卷积神经网络结构;设计应用于目标检测的深度神经网络结构,设计时要根据输入输出数据的结构来确定网络的输入层和输出层,并确定神经网络中多尺度感受野特征融合模块的个数及卷积层的个数,确定网络训练循环迭代的次数和网络最终收敛条件,步骤如下:
a)构建特征提取骨架网络模型:特征提取骨架网络用于从输入的图像中提取不同尺度、不同层次的语义信息,便于网络检测部分对物体的分类和定位,包括三部分:第一部分是骨架网络结构,输入为RGB三通道的图像,该结构包含级联的3×3卷积层,每个卷积层后面均有批量正则化层;第二部分是用来提取多尺度特征的网络结构,该结构包含级联的多尺度感受野特征融合模块,每个模块包含三个串联的3×3卷积层,再用一个1×1卷积层融合上述每个3×3卷积层的输出;第三部分是在末端添加的级联的卷积层,用于提取不同尺度的卷积特征图;
b)构建目标定位和目标分类网络:首先根据上一步设计的特征提取骨架网络结构来确定最终用于检测的特征平面;目标定位和目标分类网络分别在用于检测的特征平面上添加一个3×3卷积层;目标分类网络输出类别的分数用以分类任务,目标定位网络精修选框的位置用于回归任务,为完成分类和回归任务,目标定位和目标分类网络包含卷积层和批量正则化层;
5)根据训练的目标和模型的结构,定义所需的损失函数,训练阶段对目标的类别和检测框偏移量进行回归;
6)初始化神经网络各层的参数,对网络中卷积层采用均值为0,标准差为0.02的高斯分布进行初始化,对网络中批量正则化层中的参数采用均值为1,标准差为0.02的高斯分布进行初始化;随机输入训练集中的图像,经过步骤4)的特征提取网络得到相应的特征,再经过步骤4)的目标定位和目标分类网络输出检测结果,并通过所定义的损失函数计算相应的损失值,再通过随机梯度下降算法使得到的梯度对各层参数进行优化,即可实现一轮网络模型的训练;重复上述步骤,直到网络的目标检测的能力达到预期的效果为止。
2.根据权利要求1所述的方法,其特征在于,步骤2)的方法如下:
a)将数据集中的图像缩放到m×n像素大小,标签数据也根据对应的比例缩放到对应的大小;
b)对缩放之后的图像随机裁剪包含标签的地方得到a×b像素大小的矩形图像,其中a≤m,b≤n;
c)以0.5的概率随机水平翻转裁剪后的图像;
d)依照均值为0方差为1的高斯分布,随机调整图像的亮度、对比度、饱和度;
e)将经过上述预处理步骤的图像各通道像素值转换到[-1,1]范围内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910498679.4/1.html,转载请声明来源钻瓜专利网。





