[发明专利]一种基于标签重分配的小样本图像分类方法及系统有效
申请号: | 202110392522.0 | 申请日: | 2021-04-13 |
公开(公告)号: | CN113076437B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 陈琼;朱戈仁 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 王东东 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 分配 样本 图像 分类 方法 系统 | ||
本发明公开了一种基于标签重分配的小样本图像分类方法及系统,包括将小样本数据集划分成基类数据集与新类数据集,在基类数据集上预训练网络模型,在新类数据集上构建包含支撑集样本和查询集样本的小样本任务;利用预训练网络为支撑集样本和查询集样本提取特征,然后对提取的查询集样本特征进行聚簇,最后使用标签重分配方法为簇里的查询集样本重新分配标签;输出查询集样本的标签。本方法能够提高小样本分类的准确率。
技术领域
本发明涉及机器学习领域,具体涉及一种基于标签重分配的小样本图像分类方法及系统。
背景技术
小样本学习是一种特殊的机器学习问题,它主要研究如何利用有限的标注数据进行学习。小样本学习通常包含两个阶段的学习过程,第一个阶段在基类数据集上对深度网络模型进行预训练,第二个阶段在新类数据集上构建小样本分类任务,利用预训练网络提取样本特征然后进行分类。一个小样本任务通常包含支撑集和查询集,支撑集的样本都有标签,但是每类的样本数量只有一个或者几个,查询集样本拥有相同的类别,但是每类通常有十五个无标签的样本。小样本分类的目标就是利用有标签的支撑集样本引导查询集样本分类。传统的分类方法包括参数化的方法以及非参数化的方法。参数化的方法先利用有标签的支撑集样本通过梯度更新的方式学习一个全连接层作为分类器,然后使用分类器为查询集样本预测标签,但是由于支撑集样本数量过少,而分类器的参数却有成百上千个,这种方法存在严重的过拟合问题。非参数方法先利用支撑集每类的样本估计出类原型,然后通过计算查询集样本与支撑集类原型的相似度为查询集样本预测标签,但是当支撑集采样到异常的样本时,使用这种方法通常会估计出错误的类中心,进而将错误的标签信息传递给查询集样本,影响小样本任务的分类性能。现有的小样本分类方法都存在局限性,不能很好的提升小样本任务的分类准确率。
发明内容
为了克服现有技术存在的缺点与不足,本发明提供一种基于标签重分配的小样本图像分类方法及系统。
本发明将无监督学习方法应用到小样本学习来解决小样本分类问题,通过对无标签的查询集样本进行聚簇,同时利用簇信息以及有标签的支撑集样本的信息引导查询集样本重新分配标签,来提升小样本任务的分类准确率。
本发明采用如下技术方案:
一种基于标签重分配的小样本图像分类方法,包括:
获取小样本数据集,并将其划分为基类数据集与新类数据集,在基类数据集上预训练网络模型,在新类数据集上构建包含支撑集样本和查询集样本的小样本任务;
利用预训练网络模型提取支撑集样本和查询集样本的特征,对提取的查询集样本特征进行聚簇,使用标签重分配方法为簇里的查询集样本重新分配标签;
输出查询集样本的标签。
进一步,所述预训练网络模型包括特征提取器及分类器。
进一步,所述使用标签重新分配方法为簇里的查询样本重新分配标签,包括如下:
获得支撑集类中心;
获得簇信息矩阵;
获得余弦预测矩阵;
获取簇中心预测标签,并为查询集样本分类。
进一步,所述获取簇中心预测标签,并为查询集样本分类,具体为:
将簇信息矩阵和余弦预测矩阵对簇的预测标签的影响综合在一起得到矩阵H;
矩阵H的计算方式为:
H=(1+D)⊙(1+P)
矩阵H中的每一个元素Hi,j表示的意义为簇i被预测为类别j的概率,⊙表示hadamard积,也就是两个矩阵对应元素直接相乘,为了让簇中心的预测标签与类中心的标签能够一一对应,可以将簇中心的预测问题转化成数学上的指派问题,对下式进行求解:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110392522.0/2.html,转载请声明来源钻瓜专利网。