[发明专利]基于双特长教师模型知识融合的图像分类方法及存储介质有效
| 申请号: | 202110218021.0 | 申请日: | 2021-02-26 |
| 公开(公告)号: | CN112801209B | 公开(公告)日: | 2022-10-25 |
| 发明(设计)人: | 尤鸣宇;王伟昊;周洪钧 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06N5/00 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 应小波 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特长 教师 模型 知识 融合 图像 分类 方法 存储 介质 | ||
1.一种基于双特长教师模型知识融合的图像分类方法,其特征在于,所述的图像分类方法包括:
步骤1:通过调整训练数据分布分别对两个特长教师模型进行训练,获得双特长教师模型;
所述的步骤1具体为:
按照类别信息将训练数据集均等且分为第一子数据集和第二子数据集,采样第一子数据集中的一半数据连同第二子数据集作为第一特长教师模型的训练数据;采样第二子数据集中的一半数据连同第一子数据集作为第二特长教师模型的训练数据;使用对应的训练数据分别对第一特长教师模型和第二特长教师模型进行训练;
步骤2:对于双教师模型的不同层特征采用基于注意力转移的逐层融合方式进行融合,训练时分别对教师模型和学生模型计算注意力特征图,通过注意力特征损失函数对学生模型的特征层进行约束;
步骤3:采用选择性知识传递机制对教师模型特征进行选择性传递;
步骤4:对双教师模型进行融合训练,获取目标模型;
步骤5:使用步骤4获取的目标模型进行图像分类。
2.根据权利要求1所述的一种基于双特长教师模型知识融合的图像分类方法,其特征在于,所述的第一特长教师模型和第二特长教师模型均采用卷积神经网络的一般训练方式进行训练。
3.根据权利要求1所述的一种基于双特长教师模型知识融合的图像分类方法,其特征在于,所述的步骤2具体为:
基于注意力转移的逐层融合方式将教师模型的特征层分组,每一组获得的特征组计算注意力特征图,通过注意力特征图计算注意力特征损失函数,通过注意力特征损失函数对学生模型的特征层进行约束;
注意力特征图的计算方法为:
其中,C为类别数,Ai为对应特征层的注意力特征图。
4.根据权利要求3所述的一种基于双特长教师模型知识融合的图像分类方法,其特征在于,所述的注意力特征图的损失函数具体为:
其中,为学生模型的注意力特征图,为教师模型的注意力特征图,p为范数。
5.根据权利要求1所述的一种基于双特长教师模型知识融合的图像分类方法,其特征在于,所述的步骤3具体为:
采用选择性知识传递机制,基于信息熵或几何中心对不同教师模型的特征进行加权,实现选择性知识传递;
所述的知识传递机制的选取方法为:
计算两种不同知识传递机制下的学生模型精度和收敛速度,选择模型精度高、收敛速度快的知识传递机制。
6.根据权利要求5所述的一种基于双特长教师模型知识融合的图像分类方法,其特征在于,所述的基于信息熵的选择性知识传递机制具体为:
通过不同教师模型的Logits输出进行统一编码和信息熵计算,经过编码后的Logits信息熵计算方法为:
其中,C为类别数,p(xi)为样本xi对应其真实类别上的Logits输出值;
然后使用信息熵对每个源模型特征的表征能力进行量化评价,并作为两个源模型的融合权重。
7.根据权利要求5所述的一种基于双特长教师模型知识融合的图像分类方法,其特征在于,所述的基于几何中心的选择性知识传递机制具体为:
利用特征与其类别几何中心的距离DistC量化评价不同源模型特征的表征效果,实现共享任务域的选择性融合;
DistC的计算方法为:
Distc=||Fi-CGM||2
其中,Fi为样本对应的特征,CGM为源模型的类中心,N为C类别下的样本数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110218021.0/1.html,转载请声明来源钻瓜专利网。





