[发明专利]一种基于改进YOLOv3的目标检测方法在审
申请号: | 202211106095.6 | 申请日: | 2022-09-09 |
公开(公告)号: | CN116310699A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 孙佳琪;单慧琳;王兴涛;崔志强;钟思远;龙见洋;胡宇翔 | 申请(专利权)人: | 无锡学院 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/20;G06V10/80;G06N3/0464;G06N3/084 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 王慧 |
地址: | 214105 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov3 目标 检测 方法 | ||
1.一种基于改进YOLOv3的目标检测方法,其特征在于,包括步骤如下:
S1,选择图像数据集;
S2,采用灰度化、二值化、透视变换与边缘分割对图像进行预处理,并对图像进行缩放处理;
S3,将预处理后的图像放入MobileNetV2 Plus主干网络进行信息提取;
S4,选择三个不同大小的特征图作为预测输入,进入特征融合层;并对三个不同大小的特征图进行上采样以及拼接,再进行卷积,取输出通道为1024、512、256的三个特征图,分别输入给大、中、小三个不同先验框的输出层;
S5,对特征融合层输入的三个不同通道数的特征图,再次进行卷积,得到分类后的特征图,生成三个不同维度大小的先验框;
S6,利用损失函数对模型进行计算,更新参数。
2.根据权利要求1所述的基于改进YOLOv3的目标检测方法,其特征在于,步骤S2中,采用Resize双线性插值法,对图像进行缩放变换。
3.根据权利要求1所述的基于改进YOLOv3的目标检测方法,其特征在于,步骤S3中,所述主干网络为MobileNetV2 Plus网络中采用的DW模块全部由1*1大小的卷积核组成。
4.根据权利要求1所述的基于改进YOLOv3的目标检测方法,其特征在于,步骤S4中,采用7*7*320的特征图作为大先验框预测输入,14*14*192的特征图作为中先验框预测输入,28*28*64的特征图作为小先验框预测输入;
大先验框预测输入经过DW模块,输出到Head大先验框层,并且向下一级采样提交7*7*320特征图;
中先验框预测输入拼接上上一层输入的7*7*320特征图,经过DW模块并且拼接下采样后14*14*320的特征图;再经过DW模块,输出14*14*512特征图到head中先验框层,并且向下一级采样提交14*14*512特征图;
小先验框预测输入拼接上上一层输入的14*14*512特征图,经过DW并且下采样后28*28*512的特征图;经过DW模块,输出28*28*576特征图到head小先验框层。
5.根据权利要求4所述的基于改进YOLOv3的目标检测方法,其特征在于,步骤S5中,Head大先验框层进入DW模块以及conv层,进行1/32采样,输出为13*13*255特征图;Head大先验框层再进入DW模块以及conv层,进行1/16采样,输出为26*26*255特征图;Head大先验框层再进入DW模块以及conv层,进行1/8采样,输出为52*52*255特征图。
6.根据权利要求4所述的基于改进YOLOv3的目标检测方法,其特征在于,步骤S6中,在交叉熵之前加入权重因子形成新的损失函数FL(Pt):
FL(Pt)=-(1-Pt)γlog(Pt)
其中,γ为权重参数,log()为交叉熵损失函数,Pt值为目标物体的置信度;
并给易区分的样本添加权重α1,给难分辨的样本添加权重α2,则有:
Loss=α1*FL易区分+α2*FL难区分
其中,FL易区分为易区分的样本,置信度接近1或接近0;FL难区分为难分辨的样本,置信度在0.5附近。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡学院,未经无锡学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211106095.6/1.html,转载请声明来源钻瓜专利网。