[发明专利]基于带有噪声和不平衡的类标签的鲁棒学习方法有效

专利信息
申请号: 202211250443.7 申请日: 2022-10-13
公开(公告)号: CN115331088B 公开(公告)日: 2023-01-03
发明(设计)人: 李绍园;王蕾 申请(专利权)人: 南京航空航天大学
主分类号: G06V10/82 分类号: G06V10/82;G06V10/774;G06V10/764
代理公司: 青岛锦佳专利代理事务所(普通合伙) 37283 代理人: 朱玉建
地址: 211106 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 带有 噪声 不平衡 标签 学习方法
【说明书】:

发明公开了一种基于带有噪声和不平衡的类标签的鲁棒学习方法,其包括如下步骤:获取带有噪声且分布不平衡的数据集;初始化各项参数;搭建模型与损失函数;将数据集输入模型中进行初始训练;每次迭代训练前,教师模型将原始数据集划分为伪干净数据集和伪噪声数据集;将伪干净数据集输入模型中进行无监督对比学习以及蒸馏训练;将伪噪声数据集输入模型中进行组内对比学习以及蒸馏训练;训练完成后,使用教师模型分类器对图像进行类别预测任务。本发明方法针对数据集中不平衡分布的问题,进一步采用重加权的方式,使得在训练后期模型侧重于学习样本量较少的类别,提升了深度学习模型的准确率。

技术领域

本发明涉及一种基于带有噪声和不平衡的类标签的鲁棒学习方法。

背景技术

分类任务的实现需要大规模且高质量的数据集作为支撑。然而,与人工设计的用于实验室的数据集不同,现实世界中的数据集含有大量标噪声签,且各类数据之间呈现不平衡分布,即各类数据的数量相差悬殊。对于噪声标签,主要采用损失纠正的方法进行处理,深度神经网络在拟合标签噪声前会学习简单的样本,因此,在噪声标签学习过程中,将具有小损失的样本认为是干净样本,具有大损失的样本认为是噪声样本,从而区分噪声标签。虽然根据损失大小能够解决数据集中含有噪声的问题,但是在不平衡分布中,含有较少样本的小类样本也会因数量不足而产生较大损失,因此,当数据集中同时存在噪声与不平衡分布时,具有较大损失的样本中不仅包括噪声标签,还包括小类样本,从而导致性能的严重下降。

发明内容

本发明提出一种基于带有噪声和不平衡的类标签的鲁棒学习方法,以提升同时存在噪声标签以及类别分布不一致情况下模型的分类准确率。

本发明为了实现上述目的,采用如下技术方案:

基于带有噪声和不平衡的类标签的鲁棒学习方法,包括以下步骤:

步骤1. 获取带有噪声标签且不平衡分布的数据集D={xi,};D代表由图像xi以及对应的含有一定概率的噪声标签组成的数据集,i∈{1,N},N表示D中样本总数;

步骤2. 初始化各项参数,包括:

训练次数t=0、预训练参数Tth、噪声筛选参数η、伪标签阈值δ以及温度参数τ

步骤3. 搭建深度学习模型与损失函数,包括:学生模型S1S2S3、教师模型S0、交叉熵损失函数Lce、无监督对比损失Lucl、组内对比损失Lgcl以及蒸馏损失Ldis1Ldis2

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211250443.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top