[发明专利]一种基于类别不平衡的自适应数据增强方法在审

专利信息
申请号: 202210641749.9 申请日: 2022-06-08
公开(公告)号: CN114898162A 公开(公告)日: 2022-08-12
发明(设计)人: 于效宇;李富超;刘艳;陈颖璐 申请(专利权)人: 电子科技大学中山学院
主分类号: G06V10/764 分类号: G06V10/764;G06K9/62;G06N20/00
代理公司: 中山市粤捷信知识产权代理事务所(普通合伙) 44583 代理人: 张谦
地址: 528402 *** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 类别 不平衡 自适应 数据 增强 方法
【说明书】:

发明公开了一种基于类别不平衡的自适应数据增强方法,在原来的复制粘贴增强方法上加入自适应算法,该训练方法的步骤包括:用数据集对模型进行预训练并提取相应的评估值;对原数据集的类别不平衡进行信息统计;用预训练的评估值和统计的信息计算出模型对每个类别的偏好程度,用偏好因子p表示;在自适应算法中加入参数的调节,引入微调系数T对偏好因子进行微调,引入偏好增强系数e来扩大类别之间的偏好差异;用偏好因子和增强系数组成判别式,判断每个类别是否需要进行数据扩增;对输出的结果进行范围的合理化;复制粘贴增强根据输出的结果对类别的数量信息进行微调并同步更新对应的数据标签,用新的生成的数据集进行训练能进一步提高模型的识别性能。

技术领域

本发明涉及目标识别的复制粘贴增强方法、自适应调节、图像识别、人工智能领域,尤其涉及一种基于类别不平衡的自适应数据增强方法。

背景技术

在目标识别领域中,数据集对于深度卷积网络模型的训练来说是至关重要的。制作优质的数据集是一项非常复杂的工程,需要耗费许多资源。例如,在现实生活中每个类别出现的频率是不一样的。这在样本采集上存在很多困难。因此数据集容易出现类别不平衡的问题。而数据增强算法通过合成数据使数据集中数据的形式更加多样,增强模型的鲁棒性,是解决类别不平衡的常用方法之一。对于数据集中的类别不平衡问题,复制粘贴增强通过合成物体和背景生成新的数据来扩充模型需要的类别信息。但这些方法都是过于依赖人的直观想法。这存在一定偏差和误导。

发明内容

针对现有技术中存在的问题,本发明的目的在于提供一种基于类别不平衡的自适应数据增强方法。

为解决上述问题,本发明采用如下的技术方案。

一种基于类别不平衡的自适应数据增强方法,基于基于类别不平衡的自适应数据增强方法包括五个模块:

模型预处理模块,模型用原始的数据集进预训练,其预训练的训练量是根据实际需求而定的,预训练完成后用预训练模型提取出模型对数据集的评估值;

数据集类别不平衡信息统计模块,用数据集的标签对数据集的不平衡问题进行统计和估量;

偏好因子P的计算,模型对每个类别的偏好是通过模型的预训练和数据集的类别不平衡问题而得到的,在这个过程中,通过引入了微调系数T来调节模型对每个类别的偏好程度;

类间差异的扩增与增强判定,在自适应算法中通过引入偏好增强系数e来突出类别间偏好因子p的差异,防止因偏好因子p过小导致模型在对类别信息进行操作时失效。在训练中存在模型对某些类别过于优化或者某些类别不存在信息过少的情况,通过引入增强判定式来判断类别是否需要进行复制粘贴增强的操作;

数据与标签的更新,模型根据偏好因子来适度调整对目标信息的复制和粘贴,将生成的数据加入训练集中并同步更新对应的标签。

一种基于类别不平衡的自适应数据增强方法,其包括以下步骤:

步骤一、对模型进行预训练和统计数据集的类别不平衡信息;

步骤二、根据根据预训练的结果和统计信息计算模型对每个类别的偏好程度;

步骤三、在偏好因子中引入微调系数T与偏好增强系数e;

步骤四、构建自适应复制粘贴增强表达式;

步骤五、根据表达式生成新的数据与更新对应的标签,用新的数据集进行训练。

所述步骤一的模型预训练,模型用原始的数据集进行预训练,该预训练的训练量并不是固定的,当训练到某一个阶段时,就提取出该阶段训练权重来得出模型在前状态下对数据集的评估。

所述步骤一的数据集统计方法,该统计方法主要是评估数据集的类别不平衡问题,该方法通过使用数据集的标签文件进行统计,统计的主要内容包括每个类别物体的个数以及对目标面积大小的归类。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学中山学院,未经电子科技大学中山学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210641749.9/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top