[发明专利]梯度增强型Softmax分类器系统、训练信号产生方法及其应用有效
| 申请号: | 201910821917.0 | 申请日: | 2019-08-30 |
| 公开(公告)号: | CN110533107B | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 孙琳钧;李卫军;宁欣;张丽萍;董肖莉 | 申请(专利权)人: | 中国科学院半导体研究所 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 汤宝平 |
| 地址: | 100083 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 梯度 增强 softmax 分类 系统 训练 信号 产生 方法 及其 应用 | ||
一种梯度增强型Softmax分类器系统、训练信号产生方法及其应用,该分类器系统包括:得分计算模块,用于:将特征提取器提取的图像样本的特征向量与各个类别代理向量进行点积运算且进行归一化操作,并乘以一常数进行放缩之后得到图像样本对应各个类别的得分;以及损失计算模块,用于:通过所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值;将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数;以及将损失计算函数作为目标函数,进行最优化求解。在样本正确分类后也可以产生较强的监督信号,使得同类样本在特征空间中继续往类别中心聚集,其学习到的特征分布类别更加紧致,可区分性更强。
技术领域
本公开属于计算机视觉技术领域,涉及一种梯度增强型Softmax(软最大值)分类器系统、训练信号产生方法及其应用。
背景技术
近几年,图像分类问题是机器视觉领域中的研究热点,深度卷积神经网络的发展极大推动了图像分类技术的进步。通过对图像特征的分层抽象与数据驱动的训练方式,深度卷积神经网络可以学习到对类别变化鲁棒的图像特征。
现阶段,基于深度卷积神经网络的图像分类模型通常由两个部分构成:特征提取器和监督器。特征提取器将原始图像映射到特征空间,监督器使用提取的特征与图像的类别标签产生训练信号驱动特征提取器的学习,因此,监督器的特性直接影响特征提取器的特征提取能力进而影响分类性能。
发明内容
(一)要解决的技术问题
本公开提供了一种梯度增强型Softmax分类器系统、训练信号产生方法及其应用,以至少部分解决以上所提出的技术问题。
(二)技术方案
根据本公开的一个方面,提供了一种梯度增强型Softmax分类器系统,用作基于深度卷积神经网络的图像分类模型中训练特征提取器的监督器,包括:得分计算模块,用于:将特征提取器提取的图像样本的特征向量与各个类别代理向量进行点积运算且进行归一化操作,并乘以一常数进行放缩之后得到图像样本对应各个类别的得分;以及损失计算模块,用于:通过得分计算模块中所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值(softmax);将所述类内得分和所述类间得分的软最大值加权组合得到损失计算函数;以及将损失计算函数作为目标函数,进行最优化求解,该目标函数的最优解满足:最大化类内得分且最小化类间得分。
在本公开的一实施例中,该分类器系统中,所述图像样本对应各个类别的得分的表达式如下:
其中,si表示图像样本在第i个类别上的得分,表示wi的转置,wi为各个类别代理向量,其中i取值为1,2,…,C,C为类别的总个数;x表示图像样本的特征向量;α为一常数,用于对得分区间进行放缩;表示与x的点积运算;||*||表示二范数。
在本公开的一实施例中,该分类器系统中,所述通过得分计算模块中所述图像样本对应各个类别的得分结合图像样本的类别标签获取类内得分以及类间得分的软最大值的方法为:
基于图像样本的类别标签t,由得分计算模块得到该类别标签对应的类别的得分即为类内得分st;
基于图像样本的类别标签,将除去该类别标签对应的类别之外的其余类别计算软最大值,计算公式如下:
其中,ss为类间得分的软最大值;log表示取对数运算;∑表示求和运算,e*表示e指数运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院半导体研究所,未经中国科学院半导体研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910821917.0/2.html,转载请声明来源钻瓜专利网。





