[发明专利]基于图像属性先验的自适应软标签正则化方法有效
| 申请号: | 202110088346.1 | 申请日: | 2021-01-22 |
| 公开(公告)号: | CN112801162B | 公开(公告)日: | 2022-06-24 |
| 发明(设计)人: | 程乐超;冯尊磊;单海军;宋明黎 | 申请(专利权)人: | 之江实验室 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 杨小凡 |
| 地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 图像 属性 先验 自适应 标签 正则 方法 | ||
本发明公开了一种基于图像属性先验的自适应软标签正则化方法,包括如下步骤:S1,通过神经网络中间特征层聚合构建图像的属性表达;S2,利用重参数化方法对属性概率先验进行软采样;S3,利用现有真值标签对采样软标签进行修正和截断;S4,多尺度属性先验正则化。通过模仿人眼进行图像分类是依据图像局部属性重要性的能力,在利用少量参数的情况下,有效地缓解在图像分类任务中由于方法模型对于结果的过于自信导致的过拟合问题,有效的提升图像分类的准确性。本发明实现方法简单,手段灵活,可以比较容易地应用到一般性图像分类任务中。
技术领域
本发明涉及图像分类领域,尤其是涉及基于图像属性先验的自适应软标签正则化方法。
背景技术
随着基础硬件的发展,各种模态形式的信息(文本、语音、图像、视频等)呈现爆炸式增长。海量的数据给各种基于数据驱动的方法带来了巨大的挑战。但同时也为大数据下的人工智能发展提供了一定的机遇。最典型的就是,近几年快速发展的深度学习相关技术使得人工智能技术的发展迈上了新的台阶。图像和视频作为重要的视觉信息载体在人工智能技术的发展过程中发挥了重要的作用。面向视觉感知的人工智能算法也在近些年取得了巨大的成就,代表性的工作涵盖目标识别与检测,运动行为识别等等。针对这些工作的研究也在不断催生着产业界的各种应用,同时也作为基础研究工作推动着前沿技术的发展。在大规模图像识别挑战中,基于深度神经网络的方法也早已超过了人类的水平。尽管通用图像识别研究任务取得了一定的进展,然而在现实生活中,往往存在着一些需要更加精细化分析的任务,而这些任务由于其挑战性也受到了越来越多的关注。
然而,现有的深度学习技术在实际应用场景中由于数据的复杂性、理论的不完备性依然存在诸多不足。例如,现有的图像分类任务中,一个经常出现的问题是算法模型对于图像数据的学习陷入局部最优解后错误预测的图像过于自信使得算法模型精度难以提升。这个问题通常又被称之为深度学习模型的不确定性问题。为了缓解这个问题,例如知识蒸馏中经常用到的Temperature Scaling(TS)通常会将图像特征除以一个常数T(通常通过验证集来确定),用来控制训练和测试时图像分类时概率置信度的平缓程度。TS方法在原有的交叉熵损失函数中往往扮演着伸缩正样本而忽略负样本的角色。除此以外,LabelSmoothing(LS)标签平滑也是一种常见而有效的手段。LS方法通过将原本的硬标签和一个均匀分布混合后作为真值标签进行交叉熵计算。更进一步地,DisturbLabel(DL)则是通过随机替换真值标签达到扰动的效果。然而,现有的这些方法都没有合适地考虑图像数据本身的影响。图像的属性特征揭示了图像间的内在联系,这原本可以更好的约束图像分类任务。
发明内容
为解决现有技术的不足,实现充分利用图像属性的目的,本发明采用如下的技术方案:
本发明主要解决当前基于深度学习的图像分类方法中模型过自信(over-confident)的问题。人眼在图像分类时往往首先从图像的局部属性来辨别种类,然而现有的图像分类方法均基于图像全局特征实现图像的分类。为缓解深度学习模型的不确定性导致的过自信问题以及现有标签软化没有充分利用图像属性的不足,本发明设计了一种基于图像属性先验的自适应软标签正则化方法。该方法通过利用图像的属性先验来自适应地约束全局概率类别分布,已有的非目标类别开源分割图像数据集中的内外边缘分割知识,实现图像数据驱动的模型校准,提高图像分类的准确度。
基于图像属性先验的自适应软标签正则化方法,包括如下步骤:
S1,结合图像属性特征的先验条件概率进行算法构建,对于图像经过神经网络后的特征图计算图像局部聚合特征的统计信息和聚类中心vm,将通过线性层后进行softmax操作,计算基于图像属性的概率质量函数
S2,根据先验条件概率进行自适应软标签采样,根据采样出应用于算法训练的软标签,此时的软标签考虑了图像的属性统计特征,由于离散采样过程不可导,因此首先利用Gumbel Max来近似随机采样过程;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110088346.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





