[发明专利]基于稀疏正交的双图非负矩阵分解的图像聚类方法有效
申请号: | 201710543060.1 | 申请日: | 2017-07-05 |
公开(公告)号: | CN107341510B | 公开(公告)日: | 2020-04-14 |
发明(设计)人: | 尚荣华;孟洋;焦李成;王蓉芳;马文萍;刘芳;侯彪;王爽;张文雅 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 韦全生;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 稀疏 正交 双图非负 矩阵 分解 图像 方法 | ||
本发明提出一种基于稀疏正交的双图非负矩阵分解的图像聚类方法,用于解决现有方法中存在的图像聚类准确度低和速度慢的技术问题。实现步骤为:输入图像数据;计算数据空间相似度矩阵和特征空间相似度矩阵;计算数据空间相似度对角矩阵和特征空间相似度对角矩阵;获取标签约束矩阵;定义并初始化三个稀疏正交的双图非负矩阵分解因子矩阵;设置迭代次数;获取三个稀疏正交的双图非负矩阵分解因子矩阵的更新公式和标签约束矩阵更新公式;定义系数对角矩阵更新公式;对三个稀疏正交的双图非负矩阵分解因子矩阵、标签约束矩阵和系数对角矩阵进行更新;定义并计算低维数据表示矩阵;图像聚类并输出。本发明可用于文本、图像聚类和人脸识别等实际应用。
技术领域
本发明属于图像处理技术领域,涉及一种图像聚类方法,具体涉及一种基于稀疏正交的双图非负矩阵分解的图像聚类方法,可用于文本聚类、图像聚类和人脸识别等实际应用。
背景技术
随着照相机、摄像机和智能手机等拍摄工具的发展,图像成为人们生活中不可或缺的数据信息,而图像聚类方法作为一种有效的数据组织方法,也因此成为炙手可热的研究方向之一。图像聚类是按选择类别数将图像数据划分为几类,使同一个类中的类内相似度尽可能大,而不同的类之间的类间相似度尽可能小。常用的图像聚类算法有k-means聚类算法、层次聚类算法、SOM聚类算法和FCM聚类算法。
由于k-means聚类算法的效率高,所以随着大数据时代的到来,数据量及数据维数的不断增大,该算法在对大规模图像数据进行聚类时被广泛应用。目前,许多算法均围绕着k-means聚类算法进行扩展和改进,其中矩阵分解算法就可以对高维图像数据进行降维得到一个低维数据表示,然后采用k-means聚类算法可以对其进行有效聚类,得到较好的图像聚类效果。经典的矩阵分解算法有主成分分析(Principal Component Analysis,PCA)、奇异值分解(Singular Value Decomposition,SVD)、线性判别分析(Linear DiscriminantAnalysis,LDA)和非负矩阵分解(Non-negative Matrix Factorization,NMF)等等。相对于其他的矩阵分解算法,NMF可以把原始高维数据矩阵分解为两个低维数据矩阵,达到对原始高维数据降维的效果,并且可以有效学习目标(像文本和人脸)中的局部信息,因此在大规模文本聚类、图像聚类和人脸识别等领域得到了广泛的应用。
然而,在现实世界中有很多数据都存在少量的标签信息,而NMF算法是一种无监督算法,无法利用原始图像数据的这些标签信息,因此图像聚类的准确度一般要劣于半监督算法。针对这一问题,许多学者对无监督的矩阵分解算法进行了改进,提出了许多半监督矩阵分解算法,不仅具有NMF算法可以捕捉目标局部信息的优点,而且可以有效利用原始数据的少量标签信息,提高图像聚类的准确度。2012年,Haifeng Liu等人在IEEE Transactionson Pattern Analysis&Machine Intelligence的第34卷第7期第1299~1311页发表的文章“Constrained nonnegative matrix factorization for image representation”中提出了一种半监督矩阵分解算法,即受限的非负矩阵分解(CNMF),该算法将标签信息作为硬限制嵌入到NMF的目标函数中。在新的低维表示空间中,具有相同标签的点有共同的坐标。2016年,Mohammadreza Babaee等人在Neurocomputing第173卷第212~223页发表的文章“Discriminative nonnegative matrix factorization for dimensionalityreduction”中也提出了一种半监督矩阵分解算法,即判别的非负矩阵分解(DNMF),该算法将少量数据的标签信息加入到判别正则矩阵中,并将判别正则矩阵引入到半监督矩阵分解的目标函数中。然而,CNMF和DNMF等很多算法没有利用到数据的局部几何信息,不能充分挖掘数据的潜在结构信息,而且在图像和低维数据表示矩阵的对应关系上也缺乏一定的判别性,因此图像聚类的准确度不高,聚类效果不好。另外,NMF、CNMF和DNMF算法都没有充分利用矩阵的稀疏性,计算较为复杂,优化聚类时间较长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710543060.1/2.html,转载请声明来源钻瓜专利网。