[发明专利]用于图像分类任务的深度卷积网络训方法、装置及系统在审
申请号: | 202110132078.9 | 申请日: | 2021-01-31 |
公开(公告)号: | CN112836820A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 胡炳然;刘青松;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06T5/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图像 分类 任务 深度 卷积 网络 方法 装置 系统 | ||
本发明提供了用于图像分类任务的深度卷积网络训练方法、装置及系统,方法包括:步骤10,对训练样本进行预处理,获得数据增强的训练样本;步骤20,针对数据增强的训练样本,基于深度卷积神经网络提取图像嵌入/特征向量,得到当前的输出;步骤30,基于当前的输出和修正后的损失函数,进行梯度反传;步骤40,对所述深度卷积神经网络层的参数进行调整更新;步骤50,重复步骤10‑步骤40,将所述深度卷积神经网络层迭代训练至收敛。本发明继承了Mixup和Focal Loss两种优化方法的思想,通过重新设计损失函数,修正了这两种方法简单叠加使用造成的优化目标偏误,缓解了难易样本不均衡的问题,可以获得精度更高的深度卷积网络分类模型。
技术领域
本发明书一个或多个实施例涉及计算机技术领域,涉及一种用于图像分类任务的深度卷积网络训练方法、装置及系统,具体涉及一种图像识别的数据增强方法和损失函数设计。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述可包括可以探究的概念,但不一定是之前已经想到或者已经探究的概念。因此,除非在此指出,否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术,并且并不因为包括在本部分中就承认是现有技术。
近年来,基于深度神经网络模型的人工智能技术,在计算机视觉领域得到广泛应用,,尤其是在目标检测任务当中,一些深度学习算法模型与框架,已经表现出惊人的准确率。对于目标分类或者检测任务而言,通常在确定网络框架以后,模型的准确性在很程度上由数据集和训练模型所用的损失函数所决定。
其中,Mixup是一种非常规的数据增强方法,其以线性插值的方式来构建新的训练样本和标签,最终对标签的处理如下公式所示:
其中,(xi,yi),(xj,yj)两个数据对是原始数据集中的训练样本和其对应的标签。其中λ∈[0,1]是一个服从B分布的参数λ~Beta(α,α),α∈[0,+∞]。当进行二分类任务时其损失函数形式为:
其中,C表示任意一种用于分类任务的损失函数,例如交叉熵等。
损失抑制权值向量优化Focal Loss主要是为了解决正负样本比例严重失衡的问题。该损失函数降低了大量简单负样本在训练中所占的权重,当进行二分类任务时其函数形式为:
其中,γ为常数,yp为网络输出值,y为样本标签。
该方法也可拓展到多分类的情形。
但存在如下问题:
深度学习网络训练过程中,如果同时使用上述两种优化方法,并且直接将Lf代入C中,则优化目标出现异常改变,导致最终训练效果较差。
简要起见,以二分类任务进行说明,融合后的优化目标为:
yp表示卷积神经网络的预测输出值;log是以e为底的对数运算。λ是mixup参数,γ是focal loss参数,一般取2。
当yi=yj时,也即(1)(2)式,Lmf=Lf,此时没有问题;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110132078.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序