[发明专利]基于类激活热力图的长尾数据分类方法、系统及介质在审
申请号: | 202211487746.0 | 申请日: | 2022-11-25 |
公开(公告)号: | CN115830372A | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 吴庆耀;陈健;赖吕龙 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/045;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 激活 力图 长尾 数据 分类 方法 系统 介质 | ||
1.基于类激活热力图的长尾数据分类方法,其特征在于,包括下述步骤:
获取长尾数据集,所述长尾数据集包含多个类别,并对每个样本标注所属类别,且不同类别的样本数量具有较大差异;
构建长尾数据分类模型,所述长尾数据分类模型包括特征提取模块、类激活图模块和分类模块;所述类激活图模块位于特征提取模块和分类模块之间;
使用交叉熵损失函数在长尾数据集上预训练特征提取模块和分类模块,预训练完成后冻结特征提取模块的参数,得到长尾数据集的类别;
在长尾数据集上迭代训练长尾数据分类模型,包括:
定义长尾数据集的类别中数据量少于τ的类别为少样本类别,得到少样本类别的数据集;
将少样本类别的数据集输入类激活图模块,生成可学习的原型和标准类激活图热力图;
将标准类激活热力图转换为单通道图,并输入冻结参数的特征提取模块中重新提取少样本类别数据集的特征向量,输入分类模型中得到分类结果;
使用交叉熵损失函数迭代训练类激活图模块和分类模块,更新类激活图模块和分类模块的参数直至收敛,得到训练好的长尾数据分类模型;
将待预测长尾数据集输入训练好的长尾数据分类模型中,得到预测的分类结果。
2.根据权利要求1所述的基于类激活热力图的长尾数据分类方法,其特征在于,所述使用交叉熵损失函数在长尾数据集上预训练特征提取模块和分类模块,具体为:
输入长尾数据集到特征提取模块中,提取长尾数据集中每一样本的特征向量F;
对于长尾数据集中每一种类别c,使用每一样本的特征向量F和类别c进行全局平均池化操作得到全局表示xc;
通过全局表示xc和归一化的分类模块参数得到类别分数sc,其中wc表示分类模块对类别c的参数;
得到长尾数据集中各类别的类别分数后,通过Softmax函数确定分类结果;
使用交叉熵损失函数更新特征提取模块的参数。
3.根据权利要求2所述的基于类激活热力图的长尾数据分类方法,其特征在于,所述类别分数表示为:
其中,,表示点积操作,g为超参数,x为特征向量F经过全局平均池化后的全局表示,wc为分类模块对类别c的参数;
所述Softmax函数表示为:
其中,Softmax(sc)为Softmax函数对每个类别分数sc的预测概率,sj表示第j个类别的类别分数;
所述分类结果为预测概率最高的类别;
所述交叉熵损失函数表示为:
其中,p=[p0,···,pC-1]表示所有类别的预测概率,pi代表第i个类别的预测概率,y=[y0,···,yC-1]是样本类别的one-hot表示,当样本属于第i个类别时yi=1,否则yi=0;C是类别数量。
4.根据权利要求2所述的基于类激活热力图的长尾数据分类方法,其特征在于,所述生成可学习的原型和标准类激活图热力图,具体为:
对于每一少样本类别c′,使用该少样本类别的数据集生成一个可学习的原型Φc′;
使用少样本类别c′中K个样本经过特征提取模块得到的特征向量,并对第i个少样本特征向量的每一列取平均将其转化为一行最后合并作为原型Φc′的初始值:
使用可学习原型Φc′对该少样本类别数据集的特征向量进行卷积操作,得到标准类激活热力图公式为:
其中,Φc′表示少样本类别c′的可学习原型;Fc′少样本类别的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211487746.0/1.html,转载请声明来源钻瓜专利网。