[发明专利]一种基于数据挖掘的鲁棒半监督图像分类方法在审
| 申请号: | 202210718517.9 | 申请日: | 2022-06-13 |
| 公开(公告)号: | CN115131610A | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 王靖宇;陈城;聂飞平;李学龙 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06F17/16;G06N3/04;G06N3/08;G06V10/77;G06V10/774;G06V10/82 |
| 代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 王鲜凯 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据 挖掘 鲁棒半 监督 图像 分类 方法 | ||
本发明涉及一种基于数据挖掘的鲁棒半监督图像分类方法,将包含n个a×b像素规模图像的数据集拉长为一个图像数据矩阵,在降维处理后原始数据矩阵X的基础上,提出基于数据挖掘的鲁棒半监督图像分类模型:交替迭代优化构建得到的目标函数,对模型进行训练,从而得到分类器W和无标签数据的隶属度F。利用训练得到的W,入公式得到测试集中各样本对每类的隶属度,每个样本隶属度最大值所在列数即为该样本所属的类别,从而完成对测试集数据进行分类。本发明充分利用数据,得到更符合实际的结果;图像数据处理效率显著提升。因此,本发明在实际工程应用中的实用性更强。采用隶属度大小表征样本所属类别,受边界点的影响较小,鲁棒性较强。
技术领域
本发明属于图像分类和模式识别领域,涉及一种基于数据挖掘的鲁棒半监督图像分类方法。
背景技术
在大多数数据挖掘应用中,海量的数据比较容易获得,但数据的标签需要人工对数据进行标注,获取比较困难。数据标注是一项繁琐的工作,需要花费大量的时间和金钱。在这种情况下,如何充分利用丰富的未标记数据就显得尤为重要。使用标记数据和未标记数据来学习预测模型的半监督学习正是一种适用于这种情况的学习方法。半监督学习模型有两种类型:转导学习模型和归纳学习模型。转导半监督学习方法通过将标签从有标签的数据传播到无标签的数据来学习无标签数据的标签。这种方法的缺点是它们不能用于样本外测试,新的测试数据不包括在未标记的数据中。因此,当需要标注新的数据时,转导半监督学习方法需要将这些新的测试数据合并到已有的以前的数据中,然后基于合并的数据重构整个模型。这种方法对于样本外数据的测试效率非常低。归纳半监督学习方法使用标记数据和未标记数据来学习分类器,学习后的分类器可以用于未标记数据,也可以用于新的样本外测试数据。由于样本外测试的便利性,归纳半监督学习方法在实践中更具吸引力。
王省等人(基于光滑表示的半监督分类算法[J].计算机科学,2021,48(03):124-129.)提出了一种基于光滑表示的半监督分类算法。此方法通过构造图来挖掘数据中隐含的信息,并应用一个低通滤波器来实现数据的平滑,最后利用图的结构信息来对无标签样本进行分类。虽然该算法考虑到图构建和标签传播的同步性和数据高频信息对分类的不利影响,但该模型需要构造图挖掘数据中隐含的信息,使得算法时间复杂度较高,运行较缓慢,工程实际中应用难度较高。
目前,在图像分类领域中,高昂的标签标注成本对图像处理和检索过程造成了较大困难,进而导致处理效率的急剧下降。半监督分类方法可以挖掘无标签数据中包含的重要分类信息,并利用有标签数据的信息对无标签数据进行分类。在众多半监督分类方法中,基于图方法的研究是近年来机器学习与数据挖掘领域的研究热点之一,然而在大样本数据上,构建图会导致计算复杂缓慢。因此,如何同时提升分类效率以及分类准确率对于半监督分类方法来说仍是一个挑战。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种基于数据挖掘的鲁棒半监督图像分类方法,针对现有的半监督学习通过分类模型学习标记数据和未标记数据归纳出模型,然而分类模型对未标记数据的信息挖掘往往不如聚类模型,除此以外,基于图的半监督分类算法会导致计算缓慢的问题。
技术方案
一种基于数据挖掘的鲁棒半监督图像分类方法,其特征在于步骤如下:
步骤1:将包含n个a×b像素规模图像的数据集,拉长为一个图像数据矩阵对图像数据矩阵按行进行归一化,使各行均值为零,标准差为1,进行归一化处理,后原始数据矩阵其中n为图像个数,为单个图像的像素;
对归一化的图像数据矩阵利用PCA进行降维处理,记降维后的维度为d,处理后的图像矩阵为
步骤2:构建基于数据挖掘的鲁棒半监督图像分类模型:
s.t.P≥0,P1=1,Fl=Yl,F≥0,F1=1
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210718517.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





