[发明专利]一种基于YOLO v3的多尺度目标检测方法有效
申请号: | 202110115719.X | 申请日: | 2021-01-28 |
公开(公告)号: | CN112801183B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 陈宝远;刘奕彤;孙崐 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/80 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolo v3 尺度 目标 检测 方法 | ||
1.一种基于YOLO v3的多尺度目标检测方法,其特征在于,包括以下步骤:
S1、对数据集图像进行预处理;将图像数据调整到网络设定的尺寸;
S2、对DenseNet-121密集连接结构进行改进,即将过渡层中的池化层替换为步长为2的3*3卷积层,并使用此改进后的DenseNet-121结构替换原骨干网络中的残差结构,对输入图像进行下采样操作;
S3、在输出的几个不同尺寸的特征层之后加入空间金字塔结构;
S4、将经过空间金字塔模块后的特征图分别与上一层的特征图进行融合,构成四个尺寸的多尺寸预测机制;将经过第二次下采样,已经获得部分特征信息的104*104特征图与经过2倍上采样的52*52特征图进行融合,与尺寸为52*52,26*26和13*13的特征图共同进行特征预测,再使用convolutional 3*3结构以及双层1*1卷积结构进行进一步卷积操作;
S5、将输出的不同尺寸的特征图传递到进行检测预测的分类器中;
S6、对输入图像进行精确的类别预测、以及位置坐标的回归;
S7、计算分类网络与回归网络的多任务损失函数,并对网络进行训练优化,使分类与回归的损失函数达到收敛并保存网络的权重参数;
S8、部署优化后的参数,对目标进行检测。
2.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述步骤S1的具体步骤如下:
S101、对图像进行颜色增强、平移变化、水平以及垂直翻转;
S102、使用线性插值法将所有图像数据大小放缩到416*416。
3.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述步骤S2中加入DenseNet的具体方法为:
S201、对DenseNet-121的结构进行调整,利用改变卷积核步长的方法代替原结构中的池化操作;
S202、利用改进的DenseNet-121结构替换原骨干网络中的残差结构,在缓解梯度消失问题的同时加强特征的复用和传递。
4.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述步骤S3中输出的四个不同尺寸的特征层后加入的空间金字塔池化模块的具体操作为:将空间金字塔池化模块中的最大的池化核设置为与需要池化的特征图大小相同的尺寸,如最后一层中最小尺度的特征图大小为13*13,此时将SPP模块最大池化核设置为13以实现局部特征和全局特征的特征图级别的融合。
5.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述步骤S5中使用的分类器为:Logistic分类器,支持多标签分类。
6.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述步骤S6的具体方法为:
S601、将不同的输入图像分成s*s个单元格,对象中心坐标所在的单元格负责预测该对象的边界框信息,通过IoU值最大的预测框对输入图像进行精确的类别预测;
S602、根据单元格的左上角坐标(cx,cy)和先验框尺寸pw、ph计算预测框的中心坐标以及尺寸信息。
7.根据权利要求1所述的一种基于YOLO v3的多尺度目标检测方法,其特征在于,所述步骤S7的具体方法为:
S701、使用均方差Mean Square Error计算坐标回归损失:
第一行和第二行分别为边框中心坐标及边框的宽度和高度误差,式中表示第i个grid cell中存在对象,表示第i个grid cell的第j个bounding box中存在对象;
S702、使用交叉熵计算置信度损失和分类损失:
L2为当边框内有、无对象时的误差,L3为对象的分类误差,表示第I个grid cell的第j个bounding box中不存在对象;
S703、最后计算总的损失函数:
在计算损失函数的过程中,负责预测的预测框的坐标和存在对象的单元格才计入计算;
S704、对全连接网络进行训练,使损失函数达到收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110115719.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种LED灯压合盖板
- 下一篇:一种猴头菇益生菌复合冻干粉及其制备方法