[发明专利]集成蒸馏策略和反卷积的微小目标检测片上实现方法有效
申请号: | 201911091454.3 | 申请日: | 2019-11-10 |
公开(公告)号: | CN111179212B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 熊伟华;吴华 | 申请(专利权)人: | 杭州凝眸智能科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/0464;G06N3/0475;G06N3/084 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 310000 浙江省杭州市经济技术开*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集成 蒸馏 策略 卷积 微小 目标 检测 实现 方法 | ||
1.一种集成蒸馏策略和反卷积的微小目标检测片上实现方法,其特征在于,将用于高分辨率图像的教导网络的若干个中间特征图,采用对抗损失学习的方式对用于低分辨率图像的包含反卷积层的学习网络中的多个层进行训练,在扩大低像素图像的感受野的同时提高学习网络的输出精度并缩小片上尺寸;所述的学习网络中不含残差结构,所述的教导网络用于对抗损失学习的中间特征图经残差网络处理;
所述的学习网络包括:依次连接的卷积层、带有S型整流非线性激活单元的归一化层、卷积层、反卷积层、带有S型整流非线性激活单元的归一化层、卷积层、带有S型整流非线性激活单元的归一化层、池化层、普通卷积层和全连接层,其中:卷积层接收尺寸大小为20×20×3的输入图像并输出尺寸为20×20×32的特征图至归一化层进行归一化操作,卷积层根据特征图输出尺寸为40×40×32的特征图,反卷积层输出尺寸为40×40×32的特征图至归一化层进行归一化操作,卷积层根据特征图输出尺寸为输出尺寸为40×40×32的特征图,经过归一化层进行归一化操作,池化层根据特征图在每个2×2区域取得最大值的方式,并在宽高方向每隔2个像素采样的方式得到尺寸为20×20×32的特征图,经普通卷积层后输出至全连接层,最终输出尺寸为1×4096的向量,即图像的最终特征向量。
2.根据权利要求1所述的方法,其特征是,所述的教导网络采用ResNet50架构,即包括依次连接的卷积层、四个串联的ResNet块、最大池化层、第五个ResNet块和全连接层,其中:卷积层接收尺寸大小为40×40×3的高分辨率图像,经四个串联的ResNet块输出得到尺寸为40×40×32的特征图指导学习网络的归一化层的输出特征图,第五个ResNet块输出的尺寸为20×20×32的特征图指导学习网络的普通卷积层的输出特征,全连接层输出尺寸为1×4096的向量,即图像特征向量指导学习网络的对应的图像特征向量,即全连接层的输出。
3.根据权利要求1或2所述的方法,其特征是,所述的教导是指:教导网络输出的特征图、分别用于与学习网络的归一化层、池化层和全连接层输出的特征图、通过判别网络进行对抗训练,当两者不同时实现教导网络对学习网络的指导,最终使得学习网络的输出与教导网络一致。
4.根据权利要求3所述的方法,其特征是,所述的教导是指:教导网络对应的通道的特征图先通过互相关性找到学习网络对应层的多个通道中最相近的那个通道,即先对各自的网络的每个通道的特征数组,计算方差,再对方差进行排序,通过排序将方差高的教导网络的特征图匹配学习网络中方差高的特征图,然后再将匹配的特征图输入到一个判别网络中。
5.根据权利要求3所述的方法,其特征是,所述的对抗训练,采用InceptionV3的网络进行,通过判别器进行对抗学习来将教导网络的特征传递给学习网络。
6.根据权利要求1或2所述的方法,其特征是,所述的卷积采用逐层(depthwise)和逐点(pointwise)形式从而显著降低计算复杂度。
7.根据权利要求2所述的方法,其特征是,所述的ResNet块直接将块的元数据X直接添加到块的输出F(X),所以最终输出是H(X)=F(X)+X的结果,对其训练的目标值为F(X)=H(X)-X,即将最终输出直接减去输入元数据后剩余的剩余值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州凝眸智能科技有限公司,未经杭州凝眸智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911091454.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电池模块和电池组
- 下一篇:用于手表佩戴者的面部认证的方法