[发明专利]基于多视图的子空间聚类方法、装置、设备及存储介质在审
申请号: | 201811640929.5 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109685155A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 黄静;曹江中;戴青云;凌永权 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 子空间 聚类 视图数据 范数 优化目标函数 计算机可读存储介质 存储介质 聚类算法 视图矩阵 数据特征 鲁棒性 最优化 高阶 求解 算法 分割 引入 申请 联合 | ||
本发明实施例公开了一种基于多视图的子空间聚类方法、装置、设备及计算机可读存储介质。其中,方法包括基于提取的多视图数据的数据特征矩阵,联合矩阵的核范数和Forbenius范数作为正则项估计秩函数,并且引入张量约束,构造各视图矩阵子空间聚类的优化目标函数;求解优化目标函数的最优化问题,得到各视图的子空间表示矩阵;基于各视图的子空间表示矩阵,计算得到多视图数据的亲和矩阵;利用谱聚类算法对亲和矩阵进行分割,实现了对多视图的子空间聚类。本申请充分利用了多个视图间的高阶相关性信息,有利于提高多视图数据的聚类精度;采用矩阵的核范数联和Forbenius范数作为正则项来估计秩函数,增加了算法的鲁棒性,提升了多视图数据聚类性能。
技术领域
本发明实施例涉及模式识别计算领域,特别是涉及一种基于多视图的子空间聚类方法、装置、设备及计算机可读存储介质。
背景技术
随着信息科学技术和人工智能技术的快速发展,模式识别用于对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,从而实现对事物或现象进行描述、辨认、分类和解释,也得到相应的发展。
多视图数据广泛出现在许多应用领域,举例来说,在自然语言处理领域,一篇文档或者整个语料库可能具有多语言版本,每一种语言的版本实际上都是该文档的一个表示,例如机器翻译领域中的平行语料库。在图像检索领域,图像本身和周边的文本信息可表示为两种视图。而且,互联网也是多视图数据的另一个重要来源。在网页分类中,网页可以表示成自然语言文本,同时也可以由网页中的链接和锚文本来表示。因此,对于这些日渐丰富的多视图数据的聚类问题,已经引起了相关技术领域的广泛关注和高度重视。
多视图能够捕捉来自多个数据线索的丰富的信息以及不同数据线索中间的互补信息。因此对很多任务都适合,比如聚类、分类、减少噪声。为了将不同的特征整合到一个统一的框架,相关技术一般采用基于图的模型实现多视图聚类。
但是,相关技术中仅仅考虑了在不同视图之间的成对的关系,导致推理得到一个非凸优化问题,无法保证得到一个全局优化的结果,从而使得多视图的聚类性能差,精度不高、且鲁棒性不强。
发明内容
本公开实施例提供了一种基于多视图的子空间聚类方法、装置、设备及计算机可读存储介质,增强多视图聚类的鲁棒性,提升了多视图数据的聚类性能。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种基于多视图的子空间聚类方法,包括:
提取多视图数据的特征,得到数据特征矩阵;
基于所述数据特征矩阵,联合矩阵的核范数和Forbenius范数作为正则项估计秩函数,并且引入张量约束,构造各视图矩阵子空间聚类的优化目标函数;
求解所述优化目标函数的最优化问题,得到各视图的子空间表示矩阵;
基于各视图的子空间表示矩阵,计算得到所述多视图数据的亲和矩阵;
利用谱聚类算法对所述亲和矩阵进行分割,以实现对所述多视图数据的子空间聚类。
可选的,所述基于各视图的子空间表示矩阵,计算得到所述多视图数据的亲和矩阵包括:
采用Sv=|Z(v)|+|Z(v)|T分别计算第v个视图的亲和矩阵Sv,Z(v)为第v个视图的子空间表示矩阵;
利用下述公式计算所述多视图数据的亲和矩阵S:
V为视图总个数。
可选的,所述利用谱聚类算法对所述亲和矩阵进行分割为:
计算所述亲和矩阵的度矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811640929.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像数据标注标签的方法
- 下一篇:一种用于识别情绪的分类器的获取方法