[发明专利]一种应用于嵌入式设备的轻量级目标检测网络及训练方法在审
| 申请号: | 202011411218.8 | 申请日: | 2020-12-06 |
| 公开(公告)号: | CN112464954A | 公开(公告)日: | 2021-03-09 |
| 发明(设计)人: | 王伟栋;沈修平 | 申请(专利权)人: | 上海悠络客电子科技股份有限公司 |
| 主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海新天专利代理有限公司 31213 | 代理人: | 徐伟奇 |
| 地址: | 200000 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 应用于 嵌入式 设备 轻量级 目标 检测 网络 训练 方法 | ||
1.一种应用于嵌入式设备的轻量级目标检测网络,其特征在于,该网络由主干网络,neck网络和预测网络组成;
其中,检测网络中主干网络的输入对象为预处理后的待测图像,主干网络将输入图像映射到多个尺寸的特征图,用于检测不同尺寸的目标;neck网络由多个轻量级残差块组成,neck网络的输入端连接主干网络的输出端,其依次融和尺寸近邻的特征图,内部每个残差块在后续进一步增强对应尺寸特征图的特征表现力,最后将融合后的特征图输出到后续的预测网络进行结果预测;
所述主干网络由数个双路密集模块组成,对于输入的特征图,分别获取其在不同尺度感受野下的特征,网络每一个输出层输出的特征图尺寸分别为上一个输出特征图尺寸的1/2;neck网络将当前尺寸的特征图通过近邻插值的方式进行特征上采样后与对应的上一层输出的特征图通过拼接的方式融合;预测网络与传统单阶目标检测的预测网络类似,是一个双路网络,两条支路分别预测目标的类别以及相对于当前像素位置,目标的中心和宽高的偏移量;
通过使用非极大值抑制处理所有的预测结果,过滤不含物体的坐标框和包围相同目标的多个无效坐标框。
2.根据权利要求1所述的一种应用于嵌入式设备的轻量级目标检测网络,其特征在于,根据检测目标尺寸的分布及检测效率,主干网络输出2-3种尺寸的特征图。
3.根据权利要求1所述的一种应用于嵌入式设备的轻量级目标检测网络,其特征在于,基于检测目标坐标框的纵横比分布,自行调整主干网络输入层的尺寸。
4.根据权利要求3所述的一种应用于嵌入式设备的轻量级目标检测网络,其特征在于,根据检测目标的尺寸相对于原始图像大小,可令主干网络第一个输出特征图的大小为输入尺寸的1/8或1/4。
5.一种应用于嵌入式设备的轻量级目标检测网络的训练方法,其特征在于,该方法包含以下步骤:
(1)随机抽取数量为batch_size*2的训练样本图像,将其两两拼接,拼接方式在水平和垂直拼接中随机选择;
(2)将拼接后的图像缩放至固定尺寸并将像素值归一化至0~1区间;
(3)将预处理后的训练样本图像输入主干网络,获取多个尺寸的特征图;
(4)利用Kmeans聚类算法获取训练样本中目标框尺寸的聚类中心,根据不同数量的聚类中心计算坐标框宽高与聚类中心宽高的平均重合度,基于平均重合度和聚类中心数量变化的曲线图寻找梯度变化显著的最大聚类中心个数并将对应的聚类中心尺寸从小到大均匀分配给对应尺寸的特征图;
(5)以特征图中的每一个像素作为中心,根据分配到的不同尺寸的聚类中心尺寸构建对应数量的先验框;
(6)计算样本的目标框在不同尺寸下与对应先验框的重合度,将与目标框重合度大于等于0.5的先验框作为包含目标的正样本,反之为背景样本;
(7)计算每个先验框的预测类别与6)中真实类别的分类误差以及包含目标的的先验框相较于真实目标框在中心点和宽高上的偏移误差;
(8)通过Adam算法优化网络参数,使7)中两种误差最小化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海悠络客电子科技股份有限公司,未经上海悠络客电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011411218.8/1.html,转载请声明来源钻瓜专利网。





