[发明专利]一种多类图像半监督分类方法及系统在审
申请号: | 201410708851.1 | 申请日: | 2014-11-28 |
公开(公告)号: | CN104463202A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 张召;梁雨宸;李凡长;张莉 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 监督 分类 方法 系统 | ||
技术领域
本申请涉及数据挖掘、机器学习及模式分类技术领域,特别是涉及一种多类图像半监督分类方法及系统。
背景技术
随着信息和数据爆炸时代的到来,分类技术成为数据挖掘、模式识别等领域中最重要的研究课题之一。分类主要实现未知类别的数据的归类,在医疗数据分析、信用卡的信用分级和图像分类等领域有着重大的意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。但是真实世界中的数据(例如互联网中的图像)大多是无类别标签的,且样本的人工标定过程非常费时费力且昂贵,使得数据的准确分类有一定难度。最近,基于相似图构造的半监督学习方法在数据挖掘和模式分类等相关领域已经兴起成为强大而流行的有效工具。基于真实世界中的数据特点,半监督学习主要通过有标定样本的类别,和有标签与无标签样本间的相似性,揭示出无标签样本的类别。
近年来,由于基于标签传播理论的学习过程具有简单有效、快速等优点,故已成为半监督学习的典型代表之一。作为一种基于图的半监督学习方法,标签传播根据有标签和无标签样本间的内在关联信息,将有标签样本的标签信息传播给无标签样本,完成无标签样本的类别估计。标签传播用于半监督分类的思想于2002年由Zhu等人提出,因其效率高、复杂度低等优点引起国内外学者广泛关注,并逐渐被证实为一种简单、速度极快、可扩展性强、性能较为稳定的算法,并被广泛的运用在许多领域,如社交网络中的社会关系分析、多媒体信息检索分类等。经典的标签传播算法包括GFHF、LLGC、LNP和SLP等。目前几乎所有的研究都着眼于改进相似图的构建来提高分类性能,也取得了一些成绩。但是现有方法仍有一些缺点,例如,如何有效去除预测得到的“软类别标签”预测矩阵中的混合信号及其对分类结果的影响,以及输出的软类别标签信息是否总是满足概率的定义(即概率和为1与非负)等。
因此,提出一种基于增强型标签传播的多类图像半监督归纳式分类新方法,确保输出结果充分稀疏和满足概率定义,提高算法的适用性和鲁棒性,增强分类性能,是本领域人员亟待解决的问题。
发明内容
有鉴于此,本申请提供一种多类图像半监督分类方法及系统,以自动实现对图像的分类,提高图像分类效率、降低图像分类成本。
为了实现上述目的,本发明实施例提供的技术方案如下:
一种多类图像半监督分类方法,包括:
对训练集中的有标签图像样本和无标签图像样本进行相似性学习,构造相似近邻图,计算得到权重系数矩阵,并对所述权重系数矩阵进行对称化、归一化处理;
根据所述训练集中有标签图像样本的类别标签信息,初始化一个类标签矩阵,其中,所述类标签矩阵中额外添加第(c+1)类用于检测异类/未发现的新颖类,c为有标签图像样本的总类别数;
引入l2,1-范数正则化技术,非负约束,以及列和为1的约束,并基于所述类标签矩阵及对称化、归一化处理后的权重系数矩阵进行非负稀疏标签传播的迭代过程,得到“软类别标签”预测矩阵;
根据所述“软类别标签”预测矩阵表征的相似性概率,预测所述训练集中无标签图像样本的准确类别,得到直推式图像分类结果,训练完成半监督分类建模,生成训练模型;
利用所述训练模型对测试集中的无标签待分类的图像样本进行类别信息的预测,得到所述测试集中的无标签待分类的图像样本的类别标签,以实现对训练集以外数据的归纳过程。
优选的,所述训练集和测试集的生成过程为:
接收图像样本集合,并将图像进行向量化描述;
从进行向量化描述后的图像样本集合中选出部分图像样本数据作为训练集,其余的图像样本数据作为测试集,其中,所述训练集中包含少量有标签图像样本和适量的无标签图像样本,所述测试集中包含大量无标签的待分类图像样本。
优选的,所述对训练集中的有标签图像样本和无标签图像样本进行相似性学习,构造相似近邻图,计算得到权重系数矩阵,对所述权重系数矩阵进行对称化、归一化处理的过程为:
基于所述训练集进行K最近邻搜索,构造近邻图G,找出所述训练集中每个图像样本的K个最近邻的图像样本,所述训练集中的图像样本包括有标签图像样本和无标签图像样本;
采用Locally Linear Embedding(LLE)-重构权的构造方法,计算、衡量近邻图G中的顶点之间的相似性,构造权重系数矩阵;
将所述权重系数矩阵进行各行求和得到一个对角矩阵,其中,所述对角矩阵中的对角元素表征各个顶点在图中的重要性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410708851.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序