[发明专利]基于YOLOv4改进算法的目标检测方法、装置及系统有效
申请号: | 202110255281.5 | 申请日: | 2021-03-09 |
公开(公告)号: | CN113076804B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 杜小芳;薛新雨 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/25;G06V10/762;G06V10/774;G06V10/80;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 俞翠华 |
地址: | 430000 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 yolov4 改进 算法 目标 检测 方法 装置 系统 | ||
1.一种基于YOLOv4改进算法的目标检测方法,其特征在于,包括:
获取YOLOv4-FCSPX网络结构,所述YOLOv4-FCSPX网络结构是通过对YOLOv4网络结构中CSPX的残差结构进行浅层到深层的融合构造而成的;
获取含目标物体的图片集,所述图片集分为训练子集和测试子集;
对训练子集中图片分别进行目标物体标注,获得对应的标注框;
对所有标注框进行聚类,获得K个先验框;
将所有先验框和所述图片集中的原始图片输入至YOLOv4-FCSPX网络结构,生成特征图,得到特征图对应先验框的位置信息、类别信息和物体置信度;
基于设定的物体置信度阈值,以及特征图对应先验框的位置信息、类别信息和物体置信度,获得一定数量的候选框;
对所有候选框进行非极大值抑制,得到预测框;
基于各预测框与对应的标注框的损失值对YOLOv4-FCSPX网络结构的权值进行更新,直到损失值小于设定阈值,获得训练好的YOLOv4-FCSPX网络结构;
将测试子集中的图片输入至训练好的YOLOv4-FCSPX网络结构,获得目标物体的大小、位置及类别,完成目标检测;
所述YOLOv4-FCSPX网络结构包括:骨干Backbone、颈部Neck和头部Head三部分;所述骨干Backbone由两部分组成,一部分是卷积Conv+批标准化BN+激活函数Mish,称为CBM,另一部分是CBM与残差模块Res unitN组成的CSPX;所述CSPX的数量为5,分别记为:CSP1、CSP2、CSP8、CSP8、CSP4;所述CSP8中有8个残差模块,前6个残差模块均与最后一个残差模块进行跳接,进行浅层特征与深层特征的融合,命名为FCSP8;所述CSP4中有4个残差模块,前2个残差模块均与最后一个残差模块进行跳接,进行浅层特征与深层特征的融合,命名为FCSP4;
所述颈部Neck由两部分组成,一部分是卷积Conv+批标准化BN+激活函数Leaky relu,称为CBL,另一部分是空间金字塔池化SPP;
所述头部Head是由CBL和Conv组成。
2.根据权利要求1所述的一种基于YOLOv4改进算法的目标检测方法,其特征在于:所述标注框的获得方法包括:
利用数据标注软件labelme对训练集中图片进行车辆和行人标注,获得对应的标注框,以及目标物体的位置信息和类别信息,所述位置信息包括标注框的中心点坐标值、标注框的高宽值。
3.根据权利要求1所述的一种基于YOLOv4改进算法的目标检测方法,其特征在于:所述图片集中共包含9423帧图像,标签分为两类:车辆和行人;
所述训练子集和测试子集,比例为9:1;
利用数据标注软件labelme对数据集中的训练集进行车辆和行人标注,生成xml文件,利用python脚本voc_label将xml文件格式转换为txt文件格式。
4.根据权利要求3所述的一种基于YOLOv4改进算法的目标检测方法,其特征在于:所述先验框的个数为9,各先验框的宽高尺寸分别为12x18、14x49、17x23、24x29、31x45、41x32、52x59、83x102、159x229。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110255281.5/1.html,转载请声明来源钻瓜专利网。