[发明专利]一种基于级联的物体检测方法及系统、存储介质及终端有效
| 申请号: | 201810300288.2 | 申请日: | 2018-04-04 |
| 公开(公告)号: | CN110348453B | 公开(公告)日: | 2022-10-04 |
| 发明(设计)人: | 汪宏;叶浩;郑莹斌;邵蔚元;王丽 | 申请(专利权)人: | 中国科学院上海高等研究院;上海市信息技术研究中心 |
| 主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/40;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
| 地址: | 201210 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 级联 物体 检测 方法 系统 存储 介质 终端 | ||
1.一种基于级联的物体检测方法,其特征在于,包括以下步骤:
基于特征提取网络来获取图像的第一图像特征;
基于候选框生成网络对所述第一图像特征进行精简获取第二图像特征,并将所述第二图像特征划分为多个网格,在每个网格上生成固定数目和尺寸的候选框;基于RoI池化层提取每个候选框的图像特征,基于若干全连接层获取置信度大于预设阈值的置信候选框及其对应的第一特征向量和一次调整后的位置;
基于精调网络和所述第一图像特征获取第三图像特征;根据所述置信候选框的位置信息和所述第三图像特征基于RoI池化层获取所述置信候选框的图像特征;对于每个所述置信候选框,基于所述置信候选框的图像特征和若干全连接层生成对应的第二特征向量,并与所述第一特征向量拼接为第三特征向量;基于所述第三特征向量、所述一次调整后的位置和全连接层获取所述置信候选框二次调整后的位置和置信度。
2.根据权利要求1所述的基于级联的物体检测方法,其特征在于,所述特征提取网络采用特征融合算法获取所述第一图像特征。
3.根据权利要求1所述的基于级联的物体检测方法,其特征在于,所述特征提取网络采用VGG16网络的卷积层部分获取第一图像特征;所述候选框生成网络采用带有4个过滤器的卷积层获取第二图像特征;所述精调网络采用带64个过滤器的卷积层获取第三图像特征。
4.根据权利要求1所述的基于级联的物体检测方法,其特征在于,基于若干全连接层获取置信度大于预设阈值的置信候选框及其对应的第一特征向量时,还包括对所述置信度大于预设阈值的置信候选框进行非最大值抑制操作,获取预设数量个置信度大于预设阈值的置信候选框。
5.根据权利要求1所述的基于级联的物体检测方法,其特征在于,训练所述候选框生成网络时,将候选框和真实值的IoU大于0.5的候选框作为正样本,小于0.3的候选框作为负样本,仅基于所述正样本和所述负样本进行模型训练时的参数更新;训练所述精调网络时,将候选框与真实值IoU大于0.45的候选框作为正样本,介于0.1到0.3之间的候选框作为负样本,仅基于所述正样本和所述负样本进行模型训练时的参数更新。
6.根据权利要求1所述的基于级联的物体检测方法,其特征在于,在训练所述候选框生成网络和所述精调网络时,通过损失函数计算每个候选框的损失值,仅选择损失值最高的70%的候选框参与训练。
7.根据权利要求6所述的基于级联的物体检测方法,其特征在于,所述损失函数为多阶段联合损失函数L=αLs1+(1-α)Ls2,其中Ls1(t,s)=Lcls(s)+λLloc(t,s),Ls2(t',s')=Lcls(s')+λLloc(t',s'),Ls1,Ls2分别表示所述候选框生成网络和所述精调网络的损失函数,α表示权重;Lcls(s)=-logs,
其中,x,y表示调整后的候选框左上角的坐标,w,h表示调整后的候选框的宽度和高度,s表示所述候选框生成网络中候选框的置信度;t=(tx,ty,tw,th)表示所述候选框生成网络中调整后的候选框和调整前的候选框在x,y,w,h方向上的偏移;表示所述候选框生成网络中调整前的候选框的左上角的坐标、宽度和高度,λ表示权重系数;t',s'分别表示所述精调网络中调整后的候选框和调整前的候选框在x,y,w,h方向上的偏移和所述精调网络中候选框的置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海高等研究院;上海市信息技术研究中心,未经中国科学院上海高等研究院;上海市信息技术研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810300288.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像二值化处理方法及其系统
- 下一篇:匹配局部图像特征描述符





