[发明专利]一种非负矩阵分解聚类方法、装置及可读存储介质在审
申请号: | 202110997053.5 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113705674A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 张斌;李瑞瑜;郭宇;张雪涛;王飞 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 房鑫 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 矩阵 解聚 方法 装置 可读 存储 介质 | ||
1.一种非负矩阵分解聚类方法,其特征在于,包括以下步骤:
将输入数据映射到高维非线性空间;
自适应学习高维非线性空间下数据的潜在拓扑关系,获得样本间的邻接矩阵,并以拓扑关系约束高维映射数据的非负分解结果矩阵,完成高维空间下子流形的聚类;
通过分解非线性映射的样本矩阵得到系数矩阵,作为聚类标签,使用高维非线性空间下自适应学习得到的流形结构对其进行约束,获取高维非线性空间下的聚类结果。
2.根据权利要求1所述非负矩阵分解聚类方法,其特征在于,所述的自适应学习高维非线性空间下数据集的潜在拓扑关系,获得样本间的邻接矩阵具体包括:
使用全局结构保留方法映射子空间与原高维非线性空间的结构相似度进行获取。
3.根据权利要求2所述非负矩阵分解聚类方法,其特征在于,对于任意给定的一个非负矩阵X∈Rm×n,其中m和n分别对应这个矩阵的行和列;则按照下式在数据集X上对数据进行核映射和非负矩阵分解以获得基于原始图像的表示形式:
式中,H为非负的系数矩阵,F为映射空间中的基矩阵。
4.根据权利要求2所述非负矩阵分解聚类方法,其特征在于:
对输入数据映射出的矩阵构建相似图S以保留对应的核相似性,通过将每个数据编码为其他样本的加权组合来表示两个样本之间的相似性,构造表达式如下:
式中,γ和μ是权衡参数,S为相似性矩阵,项用于防止出现平凡解。
5.根据权利要求4所述非负矩阵分解聚类方法,其特征在于:由相似性矩阵构造具有局部数据结构信息的图正则化项,测量每两个样本之间的距离,并根据相似性矩阵来衡量两个样本;如果数据分布的原始几何图形中彼此接近,则两个点的低维表示形式也彼此接近。
6.根据权利要求5所述非负矩阵分解聚类方法,其特征在于,通过求解下式添加图正则化项:
将上式转化为矩阵迹形式如下:
min βTr(HTLSH)s.t.H≥0,S≥0
式中,β为图正则化项参数,L为拉普拉斯矩阵,L=D-S,D为对角线矩阵,其对角线元素为S的对角线元素。
7.根据权利要求6所述非负矩阵分解聚类方法,其特征在于,所述的使用高维非线性空间下自适应学习得到的子流形结构对其进行约束,获取高维非线性空间下的聚类结果具体包括:
将非负矩阵分解目标式、全局结构图学习目标式以及学习图正则化项联合,建立总体优化目标函数如下:
s.t.F≥0,H≥0,S≥0
定义核矩阵则对于内核空间的子空间元素被表示为:
因此,上述联合建立的总体优化目标函数使用核技巧展开为:
8.根据权利要求7所述非负矩阵分解聚类方法,其特征在于,对于提出的损失函数通过交替迭代求解的方法,对每个变量求出局部最优解,进行迭代优化。
9.一种非负矩阵分解聚类装置,其特征在于,包括:
映射模块,用于将输入数据映射到高维非线性空间;
自适应学习模块,用于自适应学习高维非线性空间下数据的潜在拓扑关系,获得样本间的邻接矩阵,并以拓扑关系约束高维映射数据的非负分解结果矩阵,完成高维空间下子流形的聚类;
分解聚类模块,用于通过分解非线性映射的样本矩阵得到系数矩阵,作为聚类标签,使用高维非线性空间下自适应学习得到的流形结构对其进行约束,获取高维非线性空间下的聚类结果。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述非负矩阵分解聚类方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110997053.5/1.html,转载请声明来源钻瓜专利网。