[发明专利]基于梯度重优化的半监督小样本分类方法在审
申请号: | 202111547919.9 | 申请日: | 2021-12-16 |
公开(公告)号: | CN114329124A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 吴泽彬;陈华生;徐洋;刘倩;张毅 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 梯度 优化 监督 样本 分类 方法 | ||
1.一种基于梯度重优化的半监督小样本分类方法,其特征在于,包括以下步骤:
步骤(A),对有标签数据的特征进行建模,得到一个初步模型,然后结合该模型以及伪标签生成算法得到无标签数据的伪标签,从而得到支持集的全部标签;
步骤(B),将新的支持集输入梯度重优化模块中,对支持集数据的特征进行建模,得到最终模型,再测试得到查询集的结果。
2.根据权利要求1所述的基于梯度重优化的半监督小样本分类方法,其特征在于,所述步骤(A)具体实现如下:
(A1)将有标签数据输入网络结构中,计算样本的梯度信息,再利用样本的梯度信息更新网络参数,得到一个初步模型;
(A2)利用初步模型以及伪标签生成算法得到无标签数据的伪标签。
3.根据权利要求2所述的基于梯度重优化的半监督小样本分类方法,其特征在于,步骤(A1)中的样本梯度信息计算公式具体为:
其中,x(j),y(j)分别表示模块的输入数据以及其对应的标签,fφ(x(j))表示输入样本的预测值,表示第i个任务,表示对φ求梯度。
4.根据权利要求3所述的基于梯度重优化的半监督小样本分类方法,其特征在于,步骤(A1)中的更新网络参数具体公式为:
其中,表示粗分类器的网络参数,表示有标签数据的损失函数,φ表示网络的初始参数,η表示超参数。
5.根据权利要求4所述的基于梯度重优化的半监督小样本分类方法,其特征在于,所述步骤(A2)中的伪标签生成算法,其步骤如下:
首先对无标签数据进行两次数据增强,然后利用得到的初步模型对增强后的数据进行预测,从而得到最终数据增强后的伪标签。
6.根据权利要求1所述的基于梯度重优化的半监督小样本分类方法,其特征在于:所述步骤(B)具体实现如下:
(B1)将支持集输入到梯度重优化模块中,计算样本的梯度信息,利用梯度信息再次更新网络参数,得到最终模型;
(B2)利用最终模型计算查询集的分类结果;
(B3)如果当前处于元训练阶段,则需要更新初始化参数,直到当前处于元测试阶段,分类结果即所求结果。
7.根据权利要求6所述的基于梯度重优化的半监督小样本分类方法,其特征在于,所述步骤(B1)中再次更新网络参数的公式具体为:
其中,θ*i表示精分类器的网络参数,表示支持集的损失函数,表示粗略分类器的网络参数,ε表示超参数。
8.根据权利要求7所述的基于梯度重优化的半监督小样本分类方法,其特征在于,所述步骤(B3)中更新初始化参数的公式具体为:
其中,φ表示网络的初始化参数;(η,ε)表示超参数;分别表示第n个任务时,有标签数据以及支持集对应的训练损失函数;θ*n分别表示第n个任务时,粗略分类器以及精细分类器对应的网络参数。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中任一所述的基于梯度重优化的半监督小样本分类方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的基于梯度重优化的半监督小样本分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111547919.9/1.html,转载请声明来源钻瓜专利网。