[发明专利]基于模型嵌入的鲁棒图像分类方法和装置在审
申请号: | 202110898433.3 | 申请日: | 2021-08-05 |
公开(公告)号: | CN113537389A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 沈力;张闯;宫辰 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王治东 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模型 嵌入 图像 分类 方法 装置 | ||
本公开提供一种基于模型嵌入的鲁棒图像分类方法和装置,其中,方法包括:将待分类图像输入至图像分类深度神经网络模型,输出与待分类图像对应的图像类别识别结果;其中,图像分类深度神经网络模型是通过将训练图像样本输入深度神经网络模型,获取训练图像样本在神经网络模型的最后一个隐藏层中的嵌入特征;根据嵌入特征对训练图像样本的噪声标签进行稀释;根据稀释后的标签进行样本筛选,得到筛选后的图像样本;根据筛选后的图像样本更新深度神经网络模型的模型参数,得到图像分类深度神经网络模型。本公开技术方案可以在减少标注成本的同时保证鲁棒的图像分类性能,以节约图像标注的人力物力成本。
技术领域
本公开涉及计算机技术领域,尤其涉及一种基于模型嵌入的鲁棒图像分类方法和装置。
背景技术
基于深度学习的图像分类问题在全监督场景中上取得了巨大的进步,但是全监督场景中分类算法的性能往往严重依赖于图像标注的准确性。在规模较大的实际应用中,由于标注者自身的专业知识局限性、工作疲劳等人为因素,获取的训练数据集往往是带噪声的,即有一部分图片标注不准确。如何设计鲁棒的分类模型以抵抗标签噪声带来的负面影响,是拓展图像分类模型应用场景的关键。目前也存在一些技术方案尝试设计鲁棒的图像分类模型。其中现有技术方案有利用模型预测尝试对错误的图像标注进行纠正,进而利用纠正过的图像就行后期模型训练;也有技术方案利用模型预测对训练样本进行筛选,筛选出的干净图像(标注准确的图像)将进一步用来训练后期模型。
但是,上述现有方案均存在一个严重的技术缺陷,即早期模型预测虽然能有效帮助降低标注噪声影响,但仍然有一部分顽固噪声存在,同时早期模型训练中的“早期”并不可控。更具体来说,早期模型的预测结果并不是百分百准确的,利用该预测结果进行二次训练会产生累积误差,导致迭代的分类模型越来越差。本方案提出的基于模型嵌入的方法相较于模型预测更加鲁棒,能够有效避免该累积误差问题。
众所周知,DNN需要一个较长的训练过程以得到可靠的预测,这必然和记忆效应中的“早期”存在冲突。虽然在早期训练过程中,DNN有机会去学习干净图像,但是没来得及学习出一个可靠的干净分类模型,噪声图像便参与进了训练,导致模型开始拟合噪声。其后果是,早期模型的分类性能先升后降,且不能达到最优。而利用移动平均的方法不断减少所丢弃的带噪图像的数量,以达到在DNN训练所需的“长期”和记忆效应需要的“早期”之间取了一个折衷的目的。但是该折衷需要人工调节,且调节过程费事费力。
发明内容
本公开提供一种基于模型嵌入的鲁棒图像分类方法和装置,用以解决现有技术中需要人工调节,且调节过程费事费力的缺陷,实现减少标注成本的同时保证鲁棒的图像分类性能,以节约图像标注的人力物力成本。
第一方面,本公开提供一种基于模型嵌入的鲁棒图像分类方法,包括:
获取待分类图像;
将所述待分类图像输入至图像分类深度神经网络模型,输出与所述待分类图像对应的图像类别识别结果;
其中,所述图像分类深度神经网络模型是通过下述方法训练获得:
将训练图像样本输入深度神经网络模型,获取所述训练图像样本在所述神经网络模型的最后一个隐藏层中的嵌入特征;
根据所述嵌入特征对所述训练图像样本的噪声标签进行稀释,得到稀释后的标签;
根据所述稀释后的标签进行样本筛选,得到筛选后的图像样本;
将筛选后的图像样本输入所述深度神经网络模型,更新所述深度神经网络模型的模型参数,得到所述图像分类深度神经网络模型。
根据本公开提供的一种基于模型嵌入的鲁棒图像分类方法,其中,所述根据所述嵌入特征对所述训练图像样本的噪声标签进行稀释,具体包括:
步骤一:获取每个所述训练图像样本的K近邻;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110898433.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序