[发明专利]一种基于深度学习的目标检测YOLOv3的模型优化算法在审
申请号: | 202010568883.1 | 申请日: | 2020-06-19 |
公开(公告)号: | CN112001477A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 李宋顺;周俊玮;杜振华;华宇浩;王建宇;汤徐星;何新 | 申请(专利权)人: | 南京理工大学;江苏慧宇诚智能装备研究院有限公司;南京荣新智能科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京劲创知识产权代理事务所(普通合伙) 11589 | 代理人: | 张铁兰 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 目标 检测 yolov3 模型 优化 算法 | ||
本发明公开了一种基于深度学习的目标检测YOLOv3的模型优化算法,包括:采用K‑means++聚类算法重新设置合适商品数据集的Anchor box;对目标检测YOLOv3的模型进行一般训练和稀疏化训练;将YOLOv3稀疏化后的最终模型作为基准,叠加使用通道剪枝和层剪枝进行双重剪枝,修剪不重要的特征通道和层;对剪枝后的模型进行微调,根据mAP曲线图取较好效果的值,对得到的值再次进行评估。本发明提供的基于深度学习的目标检测YOLOv3的模型优化算法,通过K‑means++改善算法的聚类效果;采用层剪枝和通道剪枝相结合的双重剪枝来进行网络剪枝,以提高算法的性能。
技术领域
本发明涉及目标检测算法技术领域,特别是涉及一种基于深度学习的目标检测YOLOv3的模型优化算法。
背景技术
传统的目标检测算法可以分为区域选择、特征提取和分类器分类三步,通过人工选择图像特征进行特征提取,特征单一且鲁棒性较差。卷积神经网络的出现改变了这种现状,它能够不依赖于人工提取特征,在图像分类领域有重大突破之后一直蓬勃发展,目前基于深度学习的目标检测算法已经成为目标检测研究的主流。
近年来,基于回归的YOLO、SSD等深度学习目标检测算法的诞生迅速占领了目标检测研究“市场”,它们降低了模型计算量的同时保持较高的精度。基于回归的YOLO深度学习目标检测算法的优点是在保持较高识别精度基础上,维持较低的参数量和计算量,以保持其快速性。其中,YOLOv3执行目标检测任务,兼备快速性和准确性,但在实际应用中的卷积神经网络系列模型的部署受限,原因有三:
第一,模型过大,CNN强大的表示能力来自其数百万个可训练的参数。这些参数以及网络结构信息需要在推理期间存储在磁盘上并加载到内存中,例如,存储经过COCO数据集训练的YOLOv3模型会消耗200MB以上的空间,这对设备来说是很大的资源负担,尤其是嵌入式等移动设备;
第二,占用运行时内存过多,在前向推理中,CNN的激活层可能比存储模型参数占用更多内存空间,不同于GPU,计算能力低的CPU设备负担过重;
第三,计算量过大,卷积操作在高分辨率图像上的计算量很大,大型的CNN可能需要几分钟才能在移动设备上处理单个图像,因此,在实际应用中采用它会因为设备受到很大局限,针对以上面临的问题,可以从缩小模型尺寸,减少运行时内存占用和在不影响准确性的情况下减少计算量出发寻找解决方案。
发明内容
本发明的目的是提供一种基于深度学习的目标检测YOLOv3的模型优化算法,设计了一种精简卷积神经网络结构的改进算法,以提高算法的性能。
为实现上述目的,本发明提供了如下方案:
一种基于深度学习的目标检测YOLOv3的模型优化算法,该算法包括以下步骤:
S1,采用K-means++聚类算法重新设置合适商品数据集的Anchor box;
S2,进行一般训练:设定YOLOv3的Darknet-53网络结构,载入数据集图片、标签和权重参数,进行前向推理,利用loss值反向求导更新权重参数,迭代一定次数,结束训练,挑选最终模型;
S3,进行稀疏化训练:对YOLOv3进行200个epoch的稀疏训练,其中使用惩罚因子值为0.001,稀疏训练的其余超参数与正常训练相同;
S4,将YOLOv3稀疏化后的最终模型作为基准,叠加使用通道剪枝和层剪枝进行双重剪枝,修剪不重要的特征通道和层;
S5,对剪枝后的模型进行微调,根据mAP曲线图取较好效果的值,对得到的值再次进行评估,如果满足优化要求,则结束优化过程,如果不满足,则需重复步骤S1-S4进一步优化,直到满足要求。
可选的,所述步骤S1中,采用K-means++聚类算法重新设置合适商品数据集的Anchor box,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学;江苏慧宇诚智能装备研究院有限公司;南京荣新智能科技有限公司,未经南京理工大学;江苏慧宇诚智能装备研究院有限公司;南京荣新智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010568883.1/2.html,转载请声明来源钻瓜专利网。