[发明专利]基于深度学习的小尺寸行人目标检测方法有效
申请号: | 201810577466.6 | 申请日: | 2018-06-07 |
公开(公告)号: | CN108960074B | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 韩冰;王云浩;杨铮;仇文亮;张景滔;李凯 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 尺寸 行人 目标 检测 方法 | ||
1.一种基于深度学习的小尺寸行人目标检测方法,包括:
(1)读取行人检测数据库数据,使用VGG卷积神经网络提取行人检测数据库数据的卷积特征:
1a)VGG卷积神经网络拥有5组卷积层,每一组内有2~3个卷积层,同时每组尾部连接一个最大池化层用来缩小卷积层尺寸,每一个卷积层使用同样尺寸的卷积核提取卷积特征;
(2)将VGG卷积神经网络不同层提取的卷积特征进行叠加融合,得到两种卷积特征融合层:
2a)将VGG卷积神经网络中第4组第3个卷积特征层Conv4_3提取的卷积特征进行反卷积处理,再将反卷积处理的结果与VGG卷积神经网络中第3组第3个卷积特征层Conv3_3提取的卷积特征进行叠加融合,得到第一种卷积特征融合层;
2b)将VGG卷积神经网络中第3组第3个卷积特征层Conv3_3、第4组第3个卷积特征层Conv4_3和第5组第3个卷积特征层Conv5_3提取的卷积特征进行叠加融合,得到第二种卷积特征融合层;
(3)根据VGG卷积神经网络中第5组第3个卷积特征层Conv5_3和2a)得到的第一种卷积特征融合层,获得最终候选区域的回归边界和分类概率:
3a)将第一种卷积特征融合层进行全卷积处理,得到第一种候选区域的回归边界和分类概率,该候选区域是指在数据中可能有行人目标的数千个区域;
3b)将VGG卷积神经网络中第5组第3个卷积特征层Conv5_3进行全卷积处理,得到第二种候选区域的回归边界和分类概率;
3c)将两种候选区域的回归边界和分类概率融合,得到最终候选区域的回归边界和分类概率;
(4)根据最终候选区域的回归边界和第二种卷积特征融合层,得到最终检测结果的回归边界和分类概率:
4a)将最终候选区域的回归边界通过RoI池化,映射到第二种卷积特征融合层中,得到每个候选区域在第二种卷积特征融合层中对应的卷积特征;
4b)将4a)得到的卷积特征进行全卷积处理,得到最终检测结果的回归边界和分类概率;
(5)根据(4)中最终检测结果的回归边界和分类概率,使用损失函数L对(1)中VGG卷积神经网络进行训练,得到最终检测结果:
5a)设损失函数L包括表示分类概率的损失子函数Lcls和表示回归边界的损失子函数Lreg,并通过下式计算分类概率的损失子函数Lcls:
其中,i为候选区域的索引,pi为每个候选区域是否代表一个行人的检测概率,为候选区域的真实标签,如果候选区域中是行人,则为1,否则,为0;
5b)计算回归边界的损失子函数Lreg,并根据Lcls和Lreg的值,得到损失函数L;
5c)通过反向传播迭代更新VGG卷积神经网络中的权值10万次,使损失函数L的值逐渐减小,得到精确的最终检测结果。
2.根据权利要求1所述的方法,其中步骤5b)中计算回归边界的损失子函数Lreg,通过下式计算:
其中,i为候选区域的索引,ti为候选区域的坐标,为行人所在区域的真实坐标。
3.根据权利要求1所述的方法,其中步骤5b)中根据Lcls和Lreg的值,得到损失函数L,通过下式计算:
其中,i为候选区域的索引,pi为每个候选区域是否代表一个行人的检测概率,为候选区域的真实标签,如果候选区域中是行人,则为1,否则为0;ti为候选区域的坐标,为行人所在区域的真实坐标,Ncls和Nreg为两个数值不同的归一化系数,Ncls取值为256,Nreg取值为2400,λ为平衡系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810577466.6/1.html,转载请声明来源钻瓜专利网。