[发明专利]一种基于改进YOLOv3的目标检测方法在审
申请号: | 202211106095.6 | 申请日: | 2022-09-09 |
公开(公告)号: | CN116310699A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 孙佳琪;单慧琳;王兴涛;崔志强;钟思远;龙见洋;胡宇翔 | 申请(专利权)人: | 无锡学院 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/20;G06V10/80;G06N3/0464;G06N3/084 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 王慧 |
地址: | 214105 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov3 目标 检测 方法 | ||
本发明公开了一种基于改进YOLOv3的目标检测方法,包括步骤:S1,选择图像数据集;S2,使用灰度化、二值化、透视变换与边缘分割对图像进行预处理,并对图像进行缩放处理;S3,将预处理后的图像放入MobileNetV2Plus主干网络进行信息提取;S4,选择三个不同大小的特征图作为预测输入,进入特征融合层;并对三个不同大小的特征图进行上采样以及拼接,再进行卷积,分别输入给大、中、小三个不同先验框的输出层;S5,对特征融合层输入的三个不同通道数的特征图,再次进行卷积,得到分类后的特征图,生成三个不同维度大小的先验框。本发明只采用1*1卷积核,降低了计算维度,加快了识别的速度。
技术领域
本发明涉及目标检测方法,尤其涉及一种基于改进YOLOv3的目标检测方法。
背景技术
近年来,人工智能技术得到广泛应用,尤其是基于神经网络的深度学习模型,在目标检测、图像分割等领域发挥了显著的作用。
自深度卷积神经网络模型在ImageNet大规模图像分辨竞赛(ILSVRC2012)上脱颖而出起,深度学习研究便进入了快速发展阶段。目前效果突出的深度卷积神经网络目标检测算法主要有两类:第一类是基于候选区域的目标检测算法,如R-CNN(Region-CNN),FastR-CNN,Faster R-CNN和Mask R-CNN等,但此类目标检测算法的检测速度较慢,无法实时检测;第二类是基于回归的目标检测算法,如SSD,YOLO,YOLOv2和YOLOv3等,此类目标检测算法的检测速度较快,能够实时检测。
但以上网络存在召回率较低,查准率较低,mAP值较低,内存占用大,识别速率慢等问题。虽然大多数网络模型计算方法都存在比较大的通用性,但无法对特定的任务实施快速部署,无法均衡检测精度和检测速度两者。
发明内容
发明目的:本发明的目的是提供一种能实现均衡检测精度和检测速度的基于改进YOLOv3的目标检测方法。
技术方案:本发明的目标检测方法,包括步骤如下:
S1,选择图像数据集;
S2,采用灰度化、二值化、透视变换与边缘分割对图像进行预处理,并对图像进行缩放处理;
S3,将预处理后的图像放入MobileNetV2 Plus主干网络进行信息提取;
S4,选择三个不同大小的特征图作为预测输入,进入特征融合层;并对三个不同大小的特征图进行上采样以及拼接,再进行卷积,取输出通道为1024、512、256的三个特征图,分别输入给大、中、小三个不同先验框的输出层;
S5,对特征融合层输入的三个不同通道数的特征图,再次进行卷积,得到分类后的特征图,生成三个不同维度大小的先验框;
S6,利用损失函数对模型进行计算,更新参数。
进一步,步骤S2中,采用Resize双线性插值法,对图像进行缩放变换。
进一步,步骤S3中,所述主干网络为MobileNetV2 Plus网络中采用的DW模块全部由1*1大小的卷积核组成。
进一步,步骤S4中,采用7*7*320的特征图作为大先验框预测输入,14*14*192的特征图作为中先验框预测输入,28*28*64的特征图作为小先验框预测输入;
大先验框预测输入经过DW模块,输出到Head大先验框层,并且向下一级采样提交7*7*320特征图;
中先验框预测输入拼接上上一层输入的7*7*320特征图,经过DW模块并且拼接下采样后14*14*320的特征图;再经过DW模块,输出14*14*512特征图到head中先验框层,并且向下一级采样提交14*14*512特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡学院,未经无锡学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211106095.6/2.html,转载请声明来源钻瓜专利网。