[发明专利]一种基于主动半监督字典学习的图像分类方法有效

申请号：	202110286617.4	申请日：	2021-03-17
公开（公告）号：	CN112861999B	公开（公告）日：	2023-09-19
发明（设计）人：	杨猛;钟琴	申请（专利权）人：	中山大学
主分类号：	G06V10/764	分类号：	G06V10/764;G06V10/774;G06N3/0895
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	刘俊
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于主动监督字典学习图像分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种基于主动半监督字典学习的图像分类方法，包括以下步骤：S1：获取训练样本集，将训练样本集分类为有标签样本集和无标签样本集；S2：构建初始的半监督字典模型；S3：分别构建有标签样本集和无标签样本集的判别表示；S4：构建图像分类目标函数；S5：结合主动学习对图像分类目标函数进行更新，得到更新好的图像分类目标函数，将更新好的图像分类目标函数用于图像分类。本发明提供一种基于主动半监督字典学习的图像分类方法，通过整合主动学习机制使得图像分类目标函数的更新更加高效并且更适用于现实场景，能够有效地利用大量无标签样本，解决了目前的图像分类方法还无法有效地利用大量无标签样本的问题。

技术领域

本发明涉及图像分类技术领域，更具体的，涉及一种基于主动半监督字典学习的图像分类方法。

背景技术

现实世界中，我们迫切需要以简单、快速有效的方式收集、分类和组织不断激增的数字图像。目前，监督学习模型在这方面已经取得了不错的研究进展，但是其性能通常严重依赖有标签样本的数量和质量。为了获得良好的监督学习模型性能，人们通常倾向于通过设计更深更复杂的网络架构与依赖于更好更大型的有标签样本。但是，有标签样本的获得所花费的代价通常是十分昂贵的，而无标签样本却相对廉价易得，目前的图像分类方法还无法有效地利用大量无标签样本。

现有技术中，如2020-07-07公开的中国专利，一种基于注意力机制的沙粒图像分类方法，公开号为CN111382676A，引入了卷积神经网络和注意力机制，在提高沙粒图像分类准确率的同时，也加快了分类的速度，但是无法有效地利用大量无标签样本。

发明内容

本发明为克服目前的图像分类方法还无法有效地利用大量无标签样本的技术缺陷，提供一种基于主动半监督字典学习的图像分类方法。

为解决上述技术问题，本发明的技术方案如下：

一种基于主动半监督字典学习的图像分类方法，包括以下步骤：

S1：获取训练样本集，将训练样本集分类为有标签样本集和无标签样本集；

S2：根据有标签样本集和无标签样本集构建初始的半监督字典模型；

S3：根据半监督字典模型分别构建有标签样本集和无标签样本集的判别表示；

S4：根据有标签样本集和无标签样本集的判别表示构建图像分类目标函数；

S5：结合主动学习对图像分类目标函数进行更新，得到更新好的图像分类目标函数，将更新好的图像分类目标函数用于图像分类。

优选的，有标签样本集的判别表示为：

其中，令A＝[A₁，...，A_c]表示有标签样本集，C为类别个数，a_i，j为第i个类别的第j个样本，n_i为第i个类别的样本数量；D＝[D₁，...，D_c]表示训练得到的半监督字典模型，D_i为第i个类别的子字典；X为类共性表示系数矩阵，x_i是A_i通过D_i得到的类共性编码系数矩阵，v_i，j是样本特殊性编码系数向量，λ和γ均为标量。

优选的，无标签样本集的判别表示为：

其中，p_i，k为第k个无标签样本b_k的类估计概率，p_i，k满足0≤p_i，k≤1且为b_k通过D_i得到的编码系数向量，β为标量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学，未经中山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110286617.4/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于内容特征和风格特征的人脸图像生成方法
下一篇：具有回转门或升降门的动物板条箱

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于主动半监督字典学习的图像分类方法有效

专利文献下载