[发明专利]一种基于向量标准化和知识蒸馏的图像分类方法有效

专利信息
申请号: 202011091695.0 申请日: 2020-10-13
公开(公告)号: CN112116030B 公开(公告)日: 2022-08-30
发明(设计)人: 郭嘉;蔡登;何晓飞;陈铭浩;胡尧;朱琛 申请(专利权)人: 浙江大学
主分类号: G06V10/764 分类号: G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 彭剑;胡红娟
地址: 310013 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 向量 标准化 知识 蒸馏 图像 分类 方法
【说明书】:

发明公开了一种基于向量标准化和知识蒸馏的图像分类方法,包括以下步骤:(1)构建并训练一个教师模型,所述教师模型采用深度卷积神经网络;(2)构建一个比教师模型小的学生模型,所述学生模型也采用深度卷积神经网络;(3)使用蒸馏损失函数对学生模型进行训练,在训练过程中,对学生模型和教师模型输出的概率编码向量进行标准化;(4)将待分类的图像输入训练好的学生模型,进行分类预测。利用本发明,能够在不引入额外参数及计算开销的情况下,提升学生网络的性能,提高图像分类精度。

技术领域

本发明属于图像分类技术领域,尤其是涉及一种基于向量标准化和知识蒸馏的图像分类方法。

背景技术

随着人工智能时代的到来,深度学习技术已被广泛应用于多种图像分类领域:如人脸识别,自动驾驶,故障检测等。

模型压缩是当前深度学习模型部署最为热门的问题之一。它要求模型在参数变少的情况下,仍保持一定的精度。目前,最热门的方法包括参数量化,模型剪枝,知识蒸馏等。其中,知识蒸馏的方法效果较好,得到了广泛的重视。

在知识蒸馏中,一个较大的模型(教师)将知识传递到一个较小的模型(学生)上。在一些数据集上,知识蒸馏能够大大提升学生网络的性能。而无人驾驶汽车在部署视觉应用时,对模型响应延时,以及计算资源具有较高的要求。

视觉模型主要由深度卷积网络组成。图像矩阵从网络的输入端输入后,在输出端输出目标分属各个类别的概率值。其中,最大的概率值所对应的类别,被视为模型的预测类别。而在那些错误的类别上,模型仍会赋予不同大小的概率。这些概率被认为编码了类别间相似度的信息。如,一只猫除了在猫的类别上赋予最大的概率值之外,还会对一些相似的类别(如狗)赋予比相差较大的类别(如汽车)更大的概率值。知识蒸馏,就是利用这样的相似度信息,利用一个较大的模型,将这种知识传递到一个较小的模型上。

然而,知识蒸馏面临被称为“容量差距”的问题。这描述了蒸馏过程中出现的一个问题,如果教师网络变得过大,学生网络的性能反而会下降。这导致在进行蒸馏时,存在需要手动选择合适大小的教师网络问题。另外,这也导致无法简单的通过使用较大的教师网络来增强学生网络的性能。

发明内容

本发明提供了一种基于向量标准化和知识蒸馏的图像分类方法,能够在不引入额外参数及计算开销的情况下,提升学生网络的性能,提高图像分类精度。

一种基于向量标准化和知识蒸馏的图像分类方法,包括以下步骤:

(1)构建并训练一个教师模型,所述教师模型采用深度卷积神经网络;

(2)构建一个比教师模型小的学生模型,所述学生模型也采用深度卷积神经网络;

(3)使用蒸馏损失函数对学生模型进行训练,在训练过程中,对学生模型和教师模型输出的概率编码向量进行标准化;

(4)学生模型训练完毕,将待分类的图像输入训练好的学生模型,进行分类预测。

本发明的方法,首先训练一个较大的深度卷积网络作为教师网络,然后在教师网络的监督信息下,训练一个较小的学生网络。该方法能够帮助一个较小的深度卷积网络保留教师网络的部分性能。同时,在概率值向量后加入了标准化方法,以解决容量差距问题。

步骤(1)的具体过程为:

(1-1)选择训练数据,对训练数据标准化以及做数据增强,随后送到深度卷积神经网络的输入层;

(1-2)将输入层得到的图像信号,送入多层卷积网络中;

(1-3)在网络的最高层,得到对类别信息的概率编码值;

(1-4)使用交叉熵损失函数对深度卷积神经网络进行训练;

(1-5)重复上述步骤,直到深度卷积神经网络收敛,得到训练好的教师模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011091695.0/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top