[发明专利]一种基于主动半监督字典学习的图像分类方法有效
| 申请号: | 202110286617.4 | 申请日: | 2021-03-17 |
| 公开(公告)号: | CN112861999B | 公开(公告)日: | 2023-09-19 |
| 发明(设计)人: | 杨猛;钟琴 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06N3/0895 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
| 地址: | 510275 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 主动 监督 字典 学习 图像 分类 方法 | ||
本发明提供一种基于主动半监督字典学习的图像分类方法,包括以下步骤:S1:获取训练样本集,将训练样本集分类为有标签样本集和无标签样本集;S2:构建初始的半监督字典模型;S3:分别构建有标签样本集和无标签样本集的判别表示;S4:构建图像分类目标函数;S5:结合主动学习对图像分类目标函数进行更新,得到更新好的图像分类目标函数,将更新好的图像分类目标函数用于图像分类。本发明提供一种基于主动半监督字典学习的图像分类方法,通过整合主动学习机制使得图像分类目标函数的更新更加高效并且更适用于现实场景,能够有效地利用大量无标签样本,解决了目前的图像分类方法还无法有效地利用大量无标签样本的问题。
技术领域
本发明涉及图像分类技术领域,更具体的,涉及一种基于主动半监督字典学习的图像分类方法。
背景技术
现实世界中,我们迫切需要以简单、快速有效的方式收集、分类和组织不断激增的数字图像。目前,监督学习模型在这方面已经取得了不错的研究进展,但是其性能通常严重依赖有标签样本的数量和质量。为了获得良好的监督学习模型性能,人们通常倾向于通过设计更深更复杂的网络架构与依赖于更好更大型的有标签样本。但是,有标签样本的获得所花费的代价通常是十分昂贵的,而无标签样本却相对廉价易得,目前的图像分类方法还无法有效地利用大量无标签样本。
现有技术中,如2020-07-07公开的中国专利,一种基于注意力机制的沙粒图像分类方法,公开号为CN111382676A,引入了卷积神经网络和注意力机制,在提高沙粒图像分类准确率的同时,也加快了分类的速度,但是无法有效地利用大量无标签样本。
发明内容
本发明为克服目前的图像分类方法还无法有效地利用大量无标签样本的技术缺陷,提供一种基于主动半监督字典学习的图像分类方法。
为解决上述技术问题,本发明的技术方案如下:
一种基于主动半监督字典学习的图像分类方法,包括以下步骤:
S1:获取训练样本集,将训练样本集分类为有标签样本集和无标签样本集;
S2:根据有标签样本集和无标签样本集构建初始的半监督字典模型;
S3:根据半监督字典模型分别构建有标签样本集和无标签样本集的判别表示;
S4:根据有标签样本集和无标签样本集的判别表示构建图像分类目标函数;
S5:结合主动学习对图像分类目标函数进行更新,得到更新好的图像分类目标函数,将更新好的图像分类目标函数用于图像分类。
优选的,有标签样本集的判别表示为:
其中,令A=[A1,...,Ac]表示有标签样本集,C为类别个数,ai,j为第i个类别的第j个样本,ni为第i个类别的样本数量;D=[D1,...,Dc]表示训练得到的半监督字典模型,Di为第i个类别的子字典;X为类共性表示系数矩阵,xi是Ai通过Di得到的类共性编码系数矩阵,vi,j是样本特殊性编码系数向量,λ和γ均为标量。
优选的,无标签样本集的判别表示为:
其中,pi,k为第k个无标签样本bk的类估计概率,pi,k满足0≤pi,k≤1且为bk通过Di得到的编码系数向量,β为标量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110286617.4/2.html,转载请声明来源钻瓜专利网。





