[发明专利]一种自适应区域精修的目标检测知识蒸馏方法有效
申请号: | 202110145846.4 | 申请日: | 2021-02-02 |
公开(公告)号: | CN112766411B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 褚晶辉;史李栋;吕卫 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06V10/778;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 区域 目标 检测 知识 蒸馏 方法 | ||
1.一种自适应区域精修的目标检测知识蒸馏方法,包括下列步骤:
(1)数据准备,把数据集分割为训练集和测试集;
(2)网络结构搭建,方法如下:
第一步:将输入的训练集图像分别送入教师网络和学生网络,提取出由学生网络得到的全部N个预测锚框Anchors,以及经过教师网络的骨干网络后输出的特征图FT,图像经过学生网络的骨干网络后输出的特征图FS′以及与其相邻卷积层输出的特征图FS″;
第二步:将所得到的预测锚框Anchors以及教师网络和学生网络所得到的特征图FT与FS′送入自适应精修模块,在真实标签Label和教师网络的共同监督下得到特征图中与被检测目标关联度极大的细粒度区域M,自适应精修模块如下:首先计算各个预测锚框Anchors与真实标签Label的IoU值,经过筛选后,得到与真实标签Label关联度大的锚框A′;然后将锚框A′的位置信息复制到教师网络所得到的特征图FT上,并将FT上非锚框位置置为0,利用高层特征图趋近于灰度图的特点,将FT上锚框位置的最大值减去特征图FT本身得到热力图;最后经过滤波后得到与被检测目标关联度极大的细粒度区域M;
第三步:将图像经过学生网络的骨干网络时在不同卷积层所得到的特征图FS′和FS″送入自注意力模块,即可得到特征图中不同通道的权重,以表示不同通道在整体特征图中的重要性程度,自注意力模块如下:通过平方差的运算计算出特征图FS′和FS″之间的差异mdif,这里特征图大小均为C×W×H,其中C为特征图的通道数量,W和H表示特征图的尺寸,得到差异mdif后取全局平均池化使其变为大小为C×1×1的张量,使用非线性运算进行激活并归一化,即可得到大小为C×1的通道注意力权重向量B,即:
B={β1,β2,…βc,…βC}
=R(Avg((FS′-FS″)2)),c∈[1,C]
其中R为ReLu的激活运算,Avg为全局平均池化运算,经过运算后得到通道注意力权重向量B,其中βc为权重向量B中第c维的数值,对应第c个通道对应的权重值;
第四步:将上述步骤中所得到的特征图FT和FS′、细粒度区域M以及不同通道的注意力权重向量B送入融合模块,使得学生网络所生成的特征图在细粒度区域结合不同通道的重要性信息,模仿教师网络所生成的特征图实现适用于目标检测的知识蒸馏,其中融合模块中所设计的损失函数表示为:
其中NCA表示细粒度区域M在特征图FT中占用的像素数量;
经过不断的反馈优化最终得到轻量化的目标检测最优模型;
(3)模型训练。
2.根据权利要求1所述的方法,其特征在于,模型训练的方法如下:
第一步:学习率设为3×10-3;
第二步:采用L2范数作为损失函数;
第三步:采用SGD优化方法,权重衰减率为0.1,动量值为0.9。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110145846.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:料理机
- 下一篇:微波与超声辅助果蔬变频离心脱水干燥的一体化装置及其应用