[发明专利]一种基于半监督自步学习跨任务深度网络的图像分类方法在审
申请号: | 201810346336.1 | 申请日: | 2018-04-18 |
公开(公告)号: | CN108764281A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 纪秋佳;吴斯;余志文 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/66;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 标注 图像分类 半监督 训练集 权重 网络 标签 高置信度 人为设计 数据集中 随机选取 图像整体 网络性能 训练过程 原始图像 真实标签 初始化 学习 预设 饱和 分类 保留 预测 重复 赋予 | ||
本发明公开了一种基于半监督自步学习跨任务深度网络的图像分类方法,包括以下步骤:S1、从图像整体数据集中随机选取少量标注样本,保留其标签,剩下所有样本作为未标注样本,在整个流程中不知道其真实标签,标注样本的权重在训练过程中恒为1,未标注样本权重初始化为0,初始时只使用标注样本作为训练集;S2、使用训练集训练跨任务深度网络;S3、根据训练好的跨任务深度网络,预测所有未标注样本的伪标签,并赋予每个未标注样本相应权重;S4、根据自步学习范式,选取高置信度的未标注样本,添加到训练集中;S5、重复步骤S2‑S4,直到跨任务深度网络性能饱和或者达到预设循环次数。所述方法不需要输入人为设计的特征,直接输入原始图像即可实现分类。
技术领域
本发明涉及计算机视觉领域,具体涉及一种基于半监督自步学习跨任务深度网络的图像分类方法。
背景技术
图像分类在过去几十年间一直是计算机视觉领域一个有挑战性的任务,因为图像的类别信息反映了人类对这些图像的高级语义认知。传统的方法一般是从图片提取一些底层特征,根据图片的标签,有监督地训练得到一个模型来预测图像标签。然而随着移动互联世界的发展,图片的数量每天都在快速增长。给这些图像作标签成为了一件非常耗人力和耗时间的事情。因此,怎么尽可能得减少人工标注的工作量,同时又能保持分类器的性能,具有重大的意义。基于半监督的方法就是一种途径。
在半监督的场景中,通常我们只有一小部分有标签的样本,还有一大部分无标签的样本。很多半监督的方法基于有标签和无标签的样本从同一分布采样的先验,采用标签传播的方法来给无标签的数据标签;也有的采用增量学习的方式,用有标签的数据得到的模型给无标签的数据伪标签,从中挑选高置信度的样本,有标签的数据和高置信度的伪标签数据再不断一起训练得到新的模型;也有的采用协同学习的方式,彼此互相纠错;还有半监督的支持向量机等方法。近几年来,随着深度学习的迅猛发展,也出现了一些基于深度学习的半监督方法,比如梯子网络,半监督的对抗生成网络等。传统的图像分类方法大多数为浅模型,无法处理大规模的数据集,但半监督的方法,初始时我们往往只有一小部分的训练数据,在训练时很容易出现网络过拟合的情况。
发明内容
本发明的目的是针对上述现有技术的不足,提供了一种基于半监督自步学习跨任务深度网络的图像分类方法,所述方法只需要人为对一部分图像进行标记即可得到具有良好分类能力的分类器,能够有效节省人工标记图像所花费的时间,具有分类精度高的优点。
本发明的目的可以通过如下技术方案实现:
一种基于半监督自步学习跨任务深度网络的图像分类方法,所述方法包括以下步骤:
S1、从图像整体数据集中随机选取少量的标注样本,保留其标签,剩下的所有样本作为未标注样本,在整个流程中不知道其真实标签,标注样本的权重在训练过程中恒为1,未标注样本的权重初始化为0,初始时只使用标注样本作为训练集;
S2、使用训练集训练跨任务深度网络;
S3、根据训练好的跨任务深度网络,预测所有未标注样本的伪标签,并赋予每个未标注样本相应的权重;
S4、根据自步学习范式,选取高置信度的未标注样本,添加到训练集中;
S5、重复步骤S2-S4,直到跨任务深度网络性能饱和或者达到预设循环次数。
进一步地,步骤S1中还需要对训练集的样本做进一步扩充,在图像四周加4个像素的零进行填充,然后再随机截取一个原图像大小的图像。
进一步地,步骤S2中的跨任务深度网络由一个包含32个卷积核的卷积层、9个残差块、一个全局平均池化层和一个softmax层依次连接组成,分为分类和聚类两个任务,所述残差块由两个相连的卷积层和一个短路连接组成,分为两种,一种会进行下采样,一种不会进行下采样,会进行下采样的残差块训练流程如下:
1)输入卷积特征图X;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810346336.1/2.html,转载请声明来源钻瓜专利网。