[发明专利]基于SE模块的SSD目标检测方法及计算机存储介质在审
申请号: | 201910769868.0 | 申请日: | 2019-08-20 |
公开(公告)号: | CN110543879A | 公开(公告)日: | 2019-12-06 |
发明(设计)人: | 毛亮;肖淳月;刘三阳;朱婷婷;王祥雪;谭焕新;黄仝宇;汪刚;侯玉清;刘双广 | 申请(专利权)人: | 高新兴科技集团股份有限公司;西安电子科技大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06N3/04 |
代理公司: | 44511 广州国鹏知识产权代理事务所(普通合伙) | 代理人: | 何志军<国际申请>=<国际公布>=<进入 |
地址: | 510530 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 小目标 神经网络模型 网络结构 卷积 替换 视频 计算机存储介质 卷积神经网络 目标检测算法 检测结果 目标检测 目标识别 主干网络 残差块 图片 保证 | ||
1.一种基于SE模块的SSD目标检测方法,其特征在于,包括以下步骤:
S1、获取需要进行目标识别的图片或者视频;
S2、将卷积神经网络ResNet18的第一个卷积层替换为3×3卷积层,并在ResNet18的第一个和第二个残差块中添加SE模块,形成SE-ResNet18网络结构;
S3、将SSD目标检测算法中的主干网络替换为所述SE-ResNet18网络结构,得到检测模型;
S4、对所述检测模型进行针对小目标检测的训练,获得训练好的深度神经网络模型;
S5、根据训练好的深度神经网络模型对所述图片或者视频的小目标进行检测,得到检测结果。
2.根据权利要求1所述的方法,其特征在于,在步骤S1中,SE模块的扩张系数为4。
3.根据权利要求1所述的方法,其特征在于,在步骤S1中,经过Res5b,输出256个大小为19×19的特征图。
4.根据权利要求1所述的方法,其特征在于,步骤S2包括:
S21、将SSD目标检测算法中的主干网络替换为所述SE-ResNet18网络结构;
S22、在所述SE-ResNet18网络结构后添加多层卷积构成多尺度特征提取网络。
5.根据权利要求4所述的方法,其特征在于,步骤S22包括:
S221、在Res5b后添加卷积核大小为3、步长为1、填充为1的最大池化层pool5,输出特征图大小和通道数不变;
S222、在Pool5后添加卷积核大小为3×3、步长为1、膨胀系数为6、填充为6的膨胀卷积层Conv6和卷积核大小为1×1、步长为1、填充为0的普通卷积层Conv7,输出1024个大小为19×19的特征图。
6.根据权利要求5所述的方法,其特征在于,步骤S22还包括:
S223、在Conv7后添加三个超参数相同的残差结构,每个残差结构分为两路:一路为两个普通卷积层,第一个卷积层的卷积核大小为3×3,步长为2、填充为1,第二个卷积层的卷积核大小仍为3×3,步长为1,填充为1;另一路为短路连接,每经过Conv7后的一个残差结构,特征图大小减半,输出通道数为256。
7.根据权利要求6所述的方法,其特征在于,短路连接由一个卷积核大小为1×1,步长为2,填充为0的普通卷积层构成。
8.根据权利要求6所述的方法,其特征在于,步骤S22还包括:
S224、在三个残差结构后添加两个普通卷积层Conv9_a和Conv9_b,Conv9_a的卷积核大小为3×3,步长为2、填充为1,Conv9_b的卷积核大小仍为3×3,步长为1,填充为1,Conv9_a和Conv9_b的输出通道数均为128。
9.根据权利要求8所述的方法,其特征在于,步骤S22还包括:
S225、选取所述SE-ResNet18网络结构中的Res4b、多尺度特征提取网络中的Conv7、Res6、Res7、Res8、Conv9_b输出的特征图用于预测,特征图大小分别为38×38、19×19、10×10、5×5、3×3和1×1,输出通道数分别为256、1024、128、128、128和128。
10.一种计算机存储介质,其特征在于,包括一条或多条计算机指令,所述一条或多条计算机指令在执行时实现如权利要求1-9中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高新兴科技集团股份有限公司;西安电子科技大学,未经高新兴科技集团股份有限公司;西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910769868.0/1.html,转载请声明来源钻瓜专利网。