[发明专利]基于自适应图的半监督学习方法在审
申请号: | 201811246236.8 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109492680A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 袁媛;王琦;李欣 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 常威威 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 半监督学习 自适应 矩阵 正则化参数 样本 算法鲁棒性 标签矩阵 错误标签 结果标签 目标函数 样本集合 软标签 最小化 缓解 更新 发现 | ||
本发明提供了一种基于自适应图的半监督学习方法。首先,构造得到样本集合的初始图和标签矩阵,并设置正则化参数;然后,通过最小化目标函数进行半监督学习,得到样本的软标签矩阵;最后,计算得到所有样本的结果标签矩阵。由于在半监督学习中自适应地进行图的更新,不易受到初始图的影响,算法鲁棒性更高;通过设置正则化参数,可以缓解错误标签带来的影响,还可以发现新的类别,在提高方法准确性的同时使得方法更具实用性。
技术领域
本发明属计算机视觉、图形处理技术领域,具体涉及一种基于自适应图的半监督学习方法。
背景技术
随着计算机网络技术的快速发展和人们对数据访问的多样化,人们可以获得的信息呈指数级别增长,如何利用这些海量数据来提高人们获取知识的能力,是当前科学家面临的共同挑战。在监督学习中,通过学习大量标记数据,建立模型来预测未标记数据,当标记的数据数量较少时,训练模型具有较弱的泛化能力并且易于过拟合。在许多实际应用中,未标记的数据非常容易获得且数量丰富,而标记数据由于标记过程需要消耗大量人力物力,其数量较少,如何通过少量的已标记样本和大量的未标记样本训练出一个较好的模型成为机器学习领域的一个重要研究方向。半监督学习(semi-supervised learning,SSL)就是为了解决上述问题而产生的。
为了有效地利用未标记数据,SSL有两个常用的假设:簇假设和流形假设。在这些假设的基础上,人们提出了许多SSL方法。基于图的半监督学习方法是基于流形假设的方法的一种,由于其性能优越、易于实现、具有良好的泛化能力,已成为最受欢迎的半监督学习方法之一。基于图的半监督学习方法通常先构造一个图,图中节点由所有样本构成,图中边的权重是样本之间的相似度,利用构造的图,将已标记样本的标签信息传播到未标记样本,从而预测未标记样本的标签(即对未标记样本分类)。因此,基于图的半监督学习方法的性能很大程度上取决于构造图的质量。Roweis等人在文献“Roweis S T,Saul L K.NonlinearDimensionality Reduction by Locally Linear Embedding[J].Science,2000,290(5500):2323.”中提出LLE算法,其基本思想则是在数据集中任意一个数据点和它的邻域点之间构造局部线性坐标,并建立最终的优化目标函数,从而保持局部的几何结构不变。Karasuyama等人在文献“Karasuyama M,Mamitsuka H.Adaptive edge weighting forgraph-based learning algorithms[J].Machine Learning,2016,106(2):1-29.”中提出自适应边缘加权策略,通过局部线性重建误差最小化来优化边缘权重,获得更高质量的图,进而增强算法性能。
上述方法的局限性在于:由于绝大部分算法默认已标记的标签是正确的,未标记数据是完全根据已标记数据进行分类,但是在实际标注中,难免会有些标记错误的样本,同时,由于已标记数据的数量远远少于未标记数据,还会存在没有标记出的新的类别;按照错误的标签对未标记数据分类会产生重大错误。其次,由初始构造图的质量对算法性能有很大的影响,初始构造图质量很差时算法性能也很差。通常算法都是在进行半监督学习之前构造与数据点权重矩阵相关联的图,在后期没有办法对图进行改进。
发明内容
为了克服现有技术的不足,本发明提供一种基于自适应图的半监督学习方法。
一种基于自适应图的半监督学习方法,其特征在于步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811246236.8/2.html,转载请声明来源钻瓜专利网。