[发明专利]一种基于轻量级YOLOV3的图像目标提取方法有效
| 申请号: | 202111496943.4 | 申请日: | 2021-12-09 |
| 公开(公告)号: | CN113902044B | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 徐嘉辉;王彬;徐凯;陈石;赵佳佳;王中杰 | 申请(专利权)人: | 江苏游隼微电子有限公司 |
| 主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06V10/40;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 吴旭 |
| 地址: | 211135 江苏省南京市栖霞区麒麟科技*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 轻量级 yolov3 图像 目标 提取 方法 | ||
本发明公开了一种基于轻量级YOLOV3的图像目标提取方法,对现有YOLOV3的主干网络结构进行改进,采用深度可分离卷积作为基本卷积块,并在深度可分离卷积之前引入一个用于升维的点卷积来加强对特征的提取能力,同时在保证同样的下采样倍数的前提下,引入残差连接,这样能大大减少了网络的参数,使得训练出的模型更易部署到低算力的嵌入式设备上。此外,本方法采用预测目标中心的方式来实现对目标的检测,相较于现有的YOLOV3,减少了网络头部所需要的参数以及复杂度,同时由于不再有大量的先验框,网络在推理的时候不需要使用非极大值抑制算法,从而能够大大增加推理的速度。
技术领域
本发明涉及目标检测领域,具体涉及一种基于改进YOLOV3的图像目标提取方法。
背景技术
目标检测的任务是找出图像中所有感兴趣的目标,并确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。
基于深度学习的目标检测算法主要分为两类:Two stage和One stage。Tow Stage的网络先进行区域生成,该区域称之为region proposal,简称RP,即一个有可能包含待检物体的预选框,再通过卷积神经网络进行样本分类。常见tow stage目标检测算法有:R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN和R-FCN等。One Stage网络追求速度舍弃了two-stage架构,即不再设置单独网络生成region proposal,而是直接在特征图上进行密集抽样,产生大量的先验框。常见的one stage目标检测算法有:YOLO、SSD和RetinaNet等。
其中YOLO系列网络是one stage中最经典的算法。首先,YOLO算法会提取出三个不同尺度的特征图,分别来进行大目标,中目标,小目标的检测,之后会在三个特征图上生成大量的先验框,再通过非极大值抑制算法对先验框进行挑选。相较于其他的网络,YOLO系列的网络速度有了很大的进步,但是,在将YOLO应用于嵌入式设备等低算力的设备处,会出现以下的问题:
1、YOLOV3的主干网络Darknet借鉴了Resnet的思想,提高了网络的特征提取能力,但是也大大增加了网络的深度与参数,使得网络训练出的模型较大,无法部署到低算力的嵌入式设备上,加大了应用落地的成本。
2、YOLOV3的先验框机制增加了网络头部的复杂度,加大了网络的参数,同时,由于网络需要使用非极大值抑制算法对先验框进行筛选,所以模型在推理的时候会花费更多的时间。
发明内容
发明目的:针对上述现有技术,提出一种基于轻量级YOLOV3的图像目标提取方法,大大减少传统YOLOV3网络的参数,使得训练出的模型更易部署到低算力的嵌入式设备上。
技术方案:一种基于轻量级YOLOV3的图像目标提取方法,包括:
步骤1:构建轻量级YOLOV3网络;
所述轻量级YOLOV3网络的主干网络包括一个CBL模块以及依次连接的若干Res模块,所述CBL模块由1*1的点卷积、深度可分离卷积、BN层和Leakyrelu构成,所述Res模块包括连接的两个所述CBL模块;输入的图片经所述主干网络下采样和特征融合后输出三个尺度的特征图,所述下采样的倍数分别为8、16、32倍;在所述下采样倍数的情况下,通过调整所述Res模块的数量来平衡网络的特征提取能力与网络参数数量;
所述轻量级YOLOV3网络的Head网络由三个conv卷积层构成,尺寸分别为:1*1*cls、1*1*2、1*1*2,其中cls表示数据集的类别数;三个conv卷积层分别输出:数据集的每一类别目标的中心点坐标预测值、目标中心点的偏移量预测值、目标尺寸预测值,所述目标尺寸即指目标所在目标框的宽和高;
步骤2:对所述轻量级YOLOV3网络进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏游隼微电子有限公司,未经江苏游隼微电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111496943.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动化测试装置
- 下一篇:一种基于Excel的测试方法、装置及存储介质
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





