[发明专利]一种用于小样本类增量学习的多粒度快慢学习方法有效

申请号：	202011504238.X	申请日：	2020-12-18
公开（公告）号：	CN112633495B	公开（公告）日：	2023-07-18
发明（设计）人：	李玺;赵涵斌;傅永健;康敏桐	申请（专利权）人：	浙江大学
主分类号：	G06N3/08	分类号：	G06N3/08;G06F18/2413;G06F18/214
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	傅朝栋;张法高
地址：	310058 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于样本增量学习粒度快慢学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于特征空间组合小样本类增量学习的图像分类方法，其特征在于，包括以下步骤：

S1、连续获取多个图像分类任务的数据流，在每个类增量学习会话中只能获得一个图像分类任务的训练数据集；

S2、在第一个类增量学习会话中，以基任务作为第一个任务的训练数据集，学习得到基任务网络模型，慢更新网络模型和快更新网络模型都以基任务网络模型作为初始化模型；

所述的基任务网络模型是由嵌入网络和最近类均值分类器组成的图像分类模型；所述嵌入网络作为特征提取器，用于将一个给定的样本映射到一个表征空间，在该表征空间中样本间的距离表示样本间的语义差异；训练得到嵌入网络后，用所述最近类均值分类器对样本进行分类；

所述的基任务网络模型中，仅有嵌入网络是可学习的，所述嵌入网络在学习过程中，以最小化度量学习损失为目的；

S3、在下一个类增量学习会话中，基于新任务的训练数据集，以慢的多粒度学习方法更新前一个类增量学习会话中训练得到的慢更新网络模型，同时以快的多粒度学习方法更新前一个类增量学习会话中训练得到的快更新网络模型；

所述慢的多粒度学习方法指在特征空间之间粒度使用小学习率更新特征空间和在特征空间内部粒度对低频分量做知识迁移时使用大权重；

所述快的多粒度学习方法指在特征空间之间粒度使用大学习率更新特征空间和在特征空间内部粒度对低频分量做知识迁移时使用小权重；

且所述大学习率为所述小学习率的5倍以上，所述大权重为所述小权重的5倍以上；

S4：完成一个类增量学习会话后，通过慢更新网络模型得到慢更新特征空间，通过快更新网络模型得到快更新特征空间，对两个特征空间进行组合，得到一个组合特征空间，利用组合特征空间进行图像分类；

S5：当存在新任务的训练数据集时，重复S3和S4，利用新数据对网络模型进行学习；

所述S1中，所述的类增量学习会话定义如下：

从当前图像分类任务的数据到达后至下一个图像分类任务的数据到达的时间间隔是一个类增量学习会话；

所述多个图像分类任务的数据流定义如下：

数据流D由N个图像分类训练数据集构成，D＝{D⁽¹⁾，D⁽²⁾，...，D^(N)}，其中第t个图像分类任务的训练数据集为D^(t)，D^(t)仅在第t个类增量学习会话中被获取到并用于模型的训练学习，在小样本类增量学习中D⁽¹⁾为基任务数据；C^(t)是第t个任务数据的类别集合，不同任务间包含的图像数据类别没有重叠；

所述的度量学习损失采用三元组损失

其中d₊表示代表图像样本x_a和正图像样本x_p的特征之间的欧式距离，d_-表示代表图像样本x_a和负图像样本x_n的特征之间的欧式距离，r表示阈值；

所述S3中，以慢的多粒度学习方法更新前一个类增量学习会话中训练得到的慢更新网络模型时，以最小化损失函数为目的对嵌入网络进行参数优化，其中：

式中是用于保持旧知识的正则项，λ是用于平衡和的系数；

为图像样本x_j的特征，通过离散余弦变换对特征分解得到不同频域分量：

式中Q是频域分量的数量，频域分量是在频域上的第q个分量，q＝1，2，...，Q；在特征空间内粒度的慢学习方法为：

式中和分别表示第t个和第t-1个类增量学习会话中的频域分量是正则项中逼近旧特征空间第q个频域分量的权重，通过增大低频频域分量的权重至所述大权重训练慢更新网络模型；

通过所述小学习率训练得到嵌入网络后，用最近类均值分类器进行分类：

式中：为第j个图像样本x_j的预测分类标签；∪_iC⁽ⁱ⁾表示所有任务数据的类别集合；dist(.，.)表示距离度量；是类别c的样本特征均值，定义如下：

式中：n_c是类别c的样本数量，[y_j＝c]表示判断y_j＝c是否成立，若成立则[y_j＝c]的值为1，否则[y_j＝c]的值为0。

所述S3中，以快的多粒度学习方法更新前一个类增量学习会话中训练得到的快更新网络模型时，以最小化损失函数为目的对嵌入网络进行参数优化，其中：

式中是用于保持旧知识的正则项；