[发明专利]半监督的小样本类别增量学习方法、装置及分类识别方法在审
| 申请号: | 202110860696.5 | 申请日: | 2021-07-29 |
| 公开(公告)号: | CN113344144A | 公开(公告)日: | 2021-09-03 |
| 发明(设计)人: | 刘丽;崔亚文;张雪毅;黄安;刘文哲 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
| 地址: | 410003 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 监督 样本 类别 增量 学习方法 装置 分类 识别 方法 | ||
1.一种半监督的小样本类别增量学习方法,其特征是,包括:
构建初始模型和初始总集;
在基本阶段时,利用基本阶段获得的基础数据集对所述初始模型进行训练学习获得所述基本阶段的模型,并将所述基础数据集加入所述初始总集获得基本阶段的总集;
在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的所述增量训练集和所述累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集;其中,所述增量训练集包含标记数据集和未标记数据集;
在模型训练过程结束后,输出训练完成的目标模型,以利用所述目标模型对所有见过类别进行分类;其中,所述模型训练过程包含一个所述基本阶段和多个所述增量阶段。
2.根据权利要求1所述的半监督的小样本类别增量学习方法,其特征在于,所述在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的所述增量训练集和所述累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集,包括:
对于每一个增量阶段,从上一阶段的总集中采样获得当前阶段的累积训练集,并在未标记数据集为非空集时,利用当前阶段的累积训练集和标记数据集对上一阶段的模型进行更新,得到迭代更新后的模型;
通过迭代更新后的模型预测所述未标记数据集,从所述未标记数据集中选取至少一个未标记数据样本和对应的伪标签加入所述标记数据集中,并从所述未标记数据集中移除,以更新所述增量训练集;
检测当前阶段是否满足迭代更新的结束条件;
若当前阶段满足迭代更新的结束条件,则结束当前阶段的迭代更新过程,并输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集;
若当前阶段不满足迭代更新的结束条件,则利用当前阶段更新后的所述增量训练集和所述累积训练集对模型再次进行迭代更新,直至当前阶段满足迭代更新的结束条件,输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集。
3.根据权利要求2所述的半监督的小样本类别增量学习方法,其特征在于,所述检测当前阶段是否满足迭代更新的结束条件,包括:
通过知识蒸馏算法计算损失值,并检测所述损失值是否小于等于损失阈值;
若所述损失值小于等于损失阈值,则确定当前阶段满足迭代更新的结束条件;否则检测当前阶段的迭代次数是否达到最大迭代次数;
若当前阶段的迭代次数达到最大迭代次数,则确定当前阶段满足迭代更新的结束条件;否则确定当前阶段不满足迭代更新的结束条件。
4.根据权利要求3所述的半监督的小样本类别增量学习方法,其特征在于,所述知识蒸馏算法包含交叉熵损失函数和蒸馏损失函数两部分,具体表示为:
,
其中,为交叉熵损失函数;为蒸馏损失函数;为超参数;为增量训练集; 为从总集中提取旧类别获得的累积训练集,为模型;
具体表示为:
,
其中,为增量训练集的数据样本数量;为数据样本的真实标签,为数据样本的预测标签;
具体表示为:
,
其中,为累积训练集的数据样本数量;为当前阶段获得的模型,为上一阶段获得的模型。
5.一种半监督的小样本类别增量学习装置,其特征在于,包括:
初始化模块,用于构建初始模型和初始总集;
基本阶段模块,用于在基本阶段时,利用基本阶段获得的基础数据集对所述初始模型进行训练学习获得所述基本阶段的模型,并将所述基础数据集加入所述初始总集获得基本阶段的总集;
增量阶段模块,用于在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的所述增量训练集和所述累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集;其中,所述增量训练集包含标记数据集和未标记数据集;
模型输出模块,用于在模型训练过程结束后,输出训练完成的目标模型,以利用所述目标模型对所有见过类别进行分类;其中,所述模型训练过程包含一个所述基本阶段和多个所述增量阶段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110860696.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:人工晶状体
- 下一篇:基于数据识别的工地粉尘控制数据处理方法





