[发明专利]一种基于改进的Focal损失函数的图像识别方法有效

专利信息
申请号: 202110117456.6 申请日: 2021-01-28
公开(公告)号: CN112819063B 公开(公告)日: 2022-07-26
发明(设计)人: 周世界;孙广鹏 申请(专利权)人: 南京邮电大学
主分类号: G06V10/764 分类号: G06V10/764;G06K9/62;G06V10/774;G06V10/82;G06N3/04;G06N3/08
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 柏尚春
地址: 210000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 focal 损失 函数 图像 识别 方法
【说明书】:

专利公开了一种基于改进的Focal损失函数的图像识别方法,在已有的Focal损失函数的基础上,对Focal损失函数的调制因子进行改进,使函数对困难样本的关注度更高,对简单样本的关注度相对下降;然后,在基于Focal损失函数的卷积神经网络模型的基础上,对剩余负样本集进行预测,筛选所有困难样本,并分成N等份,分别加入原训练集,形成N个新训练集,之后训练多个模型,根据N个模型的投票选择,确定最终预测图片标签的结果。本发明在原有的Focal损失函数的基础上,对困难样本的关注度更高,提高了模型泛化能力;在负样本过多的情形下,利用原有模型筛选出困难样本加入训练集,既提高了模型的准确性,又充分利用了可用样本,也减少了训练模型时的计算量。

技术领域

本发明属于基于深度学习的多标签图像识别技术领域,具体涉及一种基于改进的Focal损失函数的图像识别方法。

背景技术

卷积神经网络(Convolutional Neural Network,CNN)是一门专门针对图像识别问题设计的神经网络。CNN可以有效的获取原始图像的特征,并且极少经过预处理过程,相对于传统的机器学习,卷积神经网络可以自动提取图片特征,这源于卷积神经网络的两个重要特性:稀疏连接和权值共享。稀疏连接是指卷积层的节点仅仅和前一层的部分节点相连接,只用来学习局部特征。权值共享是指,用卷积核扫描图片过程中,图片中的每个位置使用同样的卷积核,所以权重相同,也就是共享。

CNN的基本结构是由输入层、卷积层、池化层、全连接层以及输出层构成。卷积层和池化层一般会取若干个,采用卷积层和池化层交替设置,即一个卷积层连接一个池化层,池化层之后在连接一个卷积层,以此类推。卷积层有多个特征面组成,每个特征面由多个神经元组成,它的每一个神经元通过卷积核与上一层特征面的局部区域连接。卷积核是一个权值矩阵(如对于二维图像而言可为2X2或者5X5矩阵),CNN的卷积层就是利用卷积核通过卷积操作提取输入的不同特征,比如一些低级特征如边缘、线条、角落,更高级的特征可由更高层的卷积层提取。池化层紧跟在卷积层之后,同样由多个特征面组成,它的每一个特征面唯一对应于其上一层的一个特征面,不会改变特征面的个数。在CNN的结构中,多个卷积层和池化层之后,连接的是一个或者一个以上的全连接层,全连接层可以整合卷积层或者池化层中的具有类别区分的局部信息。一般为了提升CNN网络性能,全连接层每个神经元的激活函数采用ReLU函数,最后一个全连接层输出值被传递给输出层。

对于识别分类任务而言,选择一个合适的损失函数是非常重要的,损失函数用来评估模型的预测值与真实值的差异程度,它也是神经网络中的目标函数。神经网络训练或优化的过程就是最小化损失函数的过程,损失函数值越小,说明模型的预测值越接近真实值,模型的准确性越好。常见的损失函数有平方损失函数、对损失函数、指数损失函数、交叉熵损失函数以及铰链损失函数等。

样本不平衡问题研究是机器学习领域的一个重要研究方向。使用数量不平衡的样本作为分类模型的训练集,会降低分类模型的泛化能力。图片分类研究早期使用手工特征方法,数据集的规模较小,即图片的数量很少,大约数百张。但是随着深度学习的崛起,小型的图片数据集已经不能满足模型训练的要求。

对于样本不平衡问题,解决问题的基本思路是使得正负样本在训练的过程有相同的权重,实践过程中,把数据集中较多的一类称为“多数类”,把样本较少的那一类称为“少数类”,解决方法有采样、数据合成、加权,一分类等。采样方法是指通过训练集进行处理,使其从不平衡的数据集变成平衡数据集。采样分为过采样和欠采样,过采样就是把少数类样本复制多份,缺点是数据集中反复出现一些样本,导致训练出来的模型会出现一定的过拟合现象;欠采样是指舍弃多余的多数类样本,缺点是最终的训练集丢失了数据,模型只学到了部分特征。数据合成方法是指利用已有样本生成更多样本,最常见的方法叫做SMOTE方法,它是利用样本空间特征的相似性来生成新样本。SMOTE方法会带来一些潜在问题,一方面增加了类别之间的重叠可能性,一方面生成一些无益样本。一分类是指,对于正负样本极不平衡的情况下,换一个不同的角度解决问题:看做一分类问题,对其中一类进行建模。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110117456.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top