[发明专利]基于SE模块的SSD目标检测方法及计算机存储介质在审
申请号: | 201910769868.0 | 申请日: | 2019-08-20 |
公开(公告)号: | CN110543879A | 公开(公告)日: | 2019-12-06 |
发明(设计)人: | 毛亮;肖淳月;刘三阳;朱婷婷;王祥雪;谭焕新;黄仝宇;汪刚;侯玉清;刘双广 | 申请(专利权)人: | 高新兴科技集团股份有限公司;西安电子科技大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06N3/04 |
代理公司: | 44511 广州国鹏知识产权代理事务所(普通合伙) | 代理人: | 何志军<国际申请>=<国际公布>=<进入 |
地址: | 510530 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 小目标 神经网络模型 网络结构 卷积 替换 视频 计算机存储介质 卷积神经网络 目标检测算法 检测结果 目标检测 目标识别 主干网络 残差块 图片 保证 | ||
本发明提供一种基于SE模块的SSD目标检测方法及计算机存储介质,所述方法包括以下步骤:S1、获取需要进行目标识别的图片或者视频;S2、将卷积神经网络ResNet18的第一个卷积层替换为3×3卷积层,并在ResNet18的第一个和第二个残差块中添加SE模块,形成SE‑ResNet18网络结构;S3、将SSD目标检测算法中的主干网络替换为所述SE‑ResNet18网络结构,得到检测模型;S4、对所述检测模型进行针对小目标检测的训练,获得训练好的深度神经网络模型;S5、根据训练好的深度神经网络模型对所述图片或者视频的小目标进行检测,得到检测结果。根据本发明实施例的方法,既保证了一定的检测速度,又提升了小目标的检测精度,同时尽量降低了对模型大小的影响。
技术领域
本发明涉及目标检测领域,更具体地,涉及一种基于SE模块的SSD目标检测方法及计算机存储介质。
背景技术
目标检测是一种基于图像的识别技术,目的是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一。其中, SSD(Single ShotDetector)目标检测算法是当前目标检测领域热门的方法之一。但SSD算法对小目标检测的效果不理想。为进一步提高目标检测算法的精度,研究者们基于SSD算法提出了一系列改进算法,如DSSD、FSSD、ESSD、 WeaveNet等。这些改进算法可归纳为两个方向:增加主干网络的深度或采用上下文融合模块为低层特征图增加更多的语义信息。这些改进算法虽然提升了检测精度,但也使网络结构变得更为复杂,明显影响了网络的模型大小和检测速度。
SSD算法不仅利用回归的思想简化神经网络的计算复杂度,提高算法的实时性,还采用anchors机制提取不同宽高比尺寸特征,提升检测不同尺度目标的鲁棒性。其网络结构主要分为两部分:一部分是位于前端的深度卷积神经网络(主干网络),采用的是去除分类层的图像分类网络,如VGG用于目标初步特征提取;另一部分是位于后端的多尺度特征检测网络,是一组级联的卷积神经网络,将前端网络产生的特征层进行不同尺度条件下的特征提取,如图1 所示。在SSD算法中,因为小尺寸目标在较低层级IOU较大,小尺寸的目标多用较低层级的anchor来训练。但由于较低层级的特征非线性程度不够,无法训练到足够的精确度,因此当前基于SSD的目标检测方法对小目标检测精度欠佳。
此外,当前基于SSD改进的目标检测方法为了提升小目标检测精度,引入的上下文融合模块(如图2)参数较多,计算量大,使得最终的模型大小往往在100MB以上,检测速度也明显降低。
综上可以看出,目前的目标检测方法主要存在以下几个缺点:
(1)经典的SSD目标检测方法对小目标检测精度欠佳。这主要是因为小尺寸的目标多用较低层级的anchor来训练,但较低层级的特征非线性程度不够,因此无法训练到足够的精确度。
(2)当前基于SSD改进的目标检测算法通过引入上下文融合模块提高目标检测精度,导致参数量增加,计算量大,使得最终的模型大小往往在100MB 以上。
发明内容
有鉴于此,本发明提供一种基于SE模块的SSD目标检测方法及计算机存储介质,既保证了检测速度,又有效提升了小目标的检测精度。
为解决上述技术问题,一方面,本发明提供一种基于SE模块的SSD目标检测方法,所述方法包括以下步骤:S1、获取需要进行目标识别的图片或者视频;S2、将卷积神经网络ResNet18的第一个卷积层替换为3×3卷积层,并在 ResNet18的第一个和第二个残差块中添加SE模块,形成SE-ResNet18网络结构;S3、将SSD目标检测算法中的主干网络替换为所述SE-ResNet18网络结构,得到检测模型;S4、对所述检测模型进行针对小目标检测的训练,获得训练好的深度神经网络模型;S5、根据训练好的深度神经网络模型对所述图片或者视频的小目标进行检测,得到检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高新兴科技集团股份有限公司;西安电子科技大学,未经高新兴科技集团股份有限公司;西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910769868.0/2.html,转载请声明来源钻瓜专利网。