[发明专利]基于目标尺度的目标检测深度卷积神经网络构建方法有效
申请号: | 201910866933.1 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110659724B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 刘天弼;杜姗姗;冯瑞 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/08 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 目标 尺度 检测 深度 卷积 神经网络 构建 方法 | ||
1.一种基于目标尺度范围的目标检测卷积神经网络构建方法,用于根据具体目标检测需求的目标尺度从而适当地调整网络结构,实现对特定目标的准确检测,其特征在于,包括:
步骤S1,分析图像样本数据集中的所有图像的目标对象,确定目标尺度下限;
步骤S2,根据用于目标检测的深度卷积神经网络的主干网结构,得到单个所述目标对象最终所需的特征数据量,并分析所述主干网结构的下采样倍数以及最佳下采样倍数;
步骤S3,通过深度模型重构方法重构所述深度卷积神经网络,保证单个所述目标对象在执行分类运算之前保留充分的特征数据量;
步骤S4,使用所述图像样本数据集对所述深度卷积神经网络进行训练直至准确率达到要求,
其中,所述深度模型重构方法分为两种方案,在所述步骤S3中重构所述深度卷积神经网络时,根据计算资源是否充足选择所述深度模型重构方法的方案:
方案一,当图像分辨率较小且所述计算资源充足时,通过所述下采样倍数以及所述最佳下采样倍数之间的落差将图像进行拉伸;
方案二,当所述计算资源有限时,根据分类预测对所述特征数据量的需求,改变所述主干网结构的下采样次数,自后向前重构网络层结构,
所述步骤S2中下采样倍数的分析方法为:
所述下采样次数为所述主干网结构中下采样操作的次数,每当特征图的分辨率在高和宽的方向上同时降低1/2时,即所述下采样倍数为2,记1次下采样操作,
设所述下采样次数为N,所述深度卷积神经网络的输入图像分辨率为h0×w0,
则所述图像经过所述主干网结构计算之后,下采样倍数为2N,特征图的高hmap和宽wmap为:
若所述图像中有l个目标,第i个目标在所述图像中的尺寸为hi×wi,则此时映射在特征图上的分辨率为hi'×wi',同理:
为了保证预测的准确性,要求:
hi'×wi'>hpre×wpre(3)
式中,hpre为每个所述目标对象所需的高,wpre为每个所述目标对象所需的宽,
同时,因目标尺度下限为Dmin,所以需满足:
通过满足式(4)唯一的决定参数是下采样次数N。
2.根据权利要求1所述的基于目标尺度范围的目标检测卷积神经网络构建方法,其特征在于:
其中,所述目标尺度以标注所述目标对象的矩形框的面积来描述:
Ascale=h×w (5)
式中,Ascale表示所述矩形框的面积,h表示所述矩形框的高,w表示所述矩形框的宽,
令所述目标尺度用D表示,则有:
Ascale=D2 (6)
即:
则所述步骤S1中所述目标尺度下限的确定方法为:
统计所述图像样本数据集中所有目标对象的所述面积,然后对所述面积计算分位数Q:
Q(Dmin)≤1-η (8)
式中,Dmin为目标尺度下限,为所述图像样本数据集的所有目标对象中所述面积在Dmin2之上的目标对象数量占总数的比例,
在式(8)的基础上,所述目标尺度下限Dmin取近似的2的整数次幂。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910866933.1/1.html,转载请声明来源钻瓜专利网。