[发明专利]一种基于集成知识蒸馏的图像分类方法有效

专利信息
申请号: 202011058365.1 申请日: 2020-09-30
公开(公告)号: CN112199535B 公开(公告)日: 2022-08-30
发明(设计)人: 杨柳;蔡登;王闻箫;何晓飞 申请(专利权)人: 浙江大学
主分类号: G06F16/55 分类号: G06F16/55;G06V10/764;G06V10/774;G06V10/82;G06N3/02;G06N3/08
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 彭剑;胡红娟
地址: 310013 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 集成 知识 蒸馏 图像 分类 方法
【权利要求书】:

1.一种基于集成知识蒸馏的图像分类方法,其特征在于,包括以下步骤:

(1)预训练教师模型,将教师模型的训练过程分为三个阶段,从每个阶段中取出一个最好的教师模型,得到3个教师模型T1、T2和T3;具体步骤为:

(1-1)对图像数据集进行预处理,然后将图像数据分批次送入教师网络中;

(1-2)训练模型使用交叉熵损失函数,使用随机梯度下降法进行模型的优化;训练过程中对学习率进行两次衰减,加速模型的收敛;

(1-3)按照学习率将教师模型的训练过程分为三个阶段,在每个阶段中选出一个测试分类准确率最好的教师模型,选出的教师模型为T1,T2和T3

(2)训练学生模型,将学生模型的训练过程划分为三个阶段,每个阶段用得到的三个教师模型来联合指导学生模型;其中,T3在每个阶段的权重保持不变;T1在第一阶段权重最大,T2在第二阶段权重最大;训练学生模型采用的损失函数为:

L=Lce(s,y)+KD(s,t3)+β1KD(s,t1)+β2KD(s,t2)

式中,Lce(s,y)为交叉熵损失函数,s表示训练过程中学生模型的输出,y表示图像的真实类别;KD()为知识蒸馏的损失函数,它是两个输出之间的Kullback-Leibler散度;t1,t2和t3分别表示T1,T2和T3在训练过程中的输出;β1,β2为超参数,分别表示T1,T2在训练学生模型时损失函数中的权重;

(3)使用训练好的学生模型进行图片分类任务,输入待分类图片,进行分类预测。

2.根据权利要求1所述的基于集成知识蒸馏的图像分类方法,其特征在于,步骤(2)中,将学生模型的训练阶段按照学习率分为三个阶段。

3.根据权利要求1所述的基于集成知识蒸馏的图像分类方法,其特征在于,在学生模型训练的三个阶段中,β1,β2的取值为:

其中,a,b,η为超参数,从上式看出,T1在第一阶段权重最大,第二阶段和第三阶段的权重依次减小;T2在第二阶段权重最大,在第一阶段和第三阶段的权重相同。

4.根据权利要求1所述的基于集成知识蒸馏的图像分类方法,其特征在于,所述的教师网络和学生模型均采用ResNet网络或MobileNet网络。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011058365.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top