[发明专利]一种可伸缩性的图像聚类方法有效

专利信息
申请号: 201910028637.4 申请日: 2019-01-11
公开(公告)号: CN109858529B 公开(公告)日: 2022-11-01
发明(设计)人: 梁奕念;吴宗泽;任志刚;谢胜利;李建中;曾德宇 申请(专利权)人: 广东工业大学
主分类号: G06V10/762 分类号: G06V10/762;G06V10/74
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510006 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 伸缩性 图像 方法
【说明书】:

发明公开了一种可伸缩性的图像聚类方法,应用于图像聚类领域,用于解决现有技术对大规模数据进行聚类时准确率低,时间内存消耗大的问题。本发明通过选取大规模数据中的代表点来构建数据的相似矩阵,代入到鲁棒集成谱聚类模型中使聚类模型运算更简便,计算效率相比原来用全部数据来构建相似矩阵进行迭代运算的方法得到显著提升。

技术领域

本发明涉及图像聚类领域,更具体地,涉及一种可伸缩性的图像聚类方法。

背景技术

随着计算机技术和互联网技术的飞速发展及智能手机、照相机的广泛应用,形成了海量的图像、视频信息环境。面对海量的图像数据,如何从中发现出有用的图像信息成为一个亟待解决的难题,而图像聚类技术为图像重复信息的发现提供了有力的支撑。图像聚类方法研究涉及图像搜索引擎、数字照片的个性化管理、敏感图像的识别与过滤、艺术图像鉴别等等,具有十分重要的现实意义,相关研究领域的最新知识与研究成果都可以创新性地应用到解决生活各方面的问题中,以促进图像聚类技术的快速发展。

图像特征提取方法和聚类算法是图像聚类中涉及的两大关键技术。传统的聚类算法例如:Sparse subspace clustering(稀疏的子空间聚类SSC),Low rankrepresentation(低秩表示LRR),Robust spectral ensemble clustering(鲁棒谱系聚类RSEC)等已经比较成功的解决了低维数据的聚类问题,但是由于实际应用中数据的复杂性,在处理许多问题时,现有的算法经常失效,特别是对于高维数据和大型数据的情况。许多聚类算法在小于200个数据对象的小数据集合上工作得很好,但是一个大规模数据库可能包含几百万个对象,在这样的大数据集合样本上进行聚类不仅会导致准确率低的技术问题,也会导致内存消耗大的问题。

发明内容

本发明为克服上述现有技术所述的对大规模数据进行聚类时准确率低,内存消耗大的缺陷,提供一种可伸缩性的图像聚类方法。

为解决上述技术问题,本发明的技术方案如下:一种可伸缩性的图像聚类方法,包括以下步骤:

S1:选取图像数据集X并对其进行归一化,将归一化后的数据集X进行p次快速聚类运算,获得p个基本聚类的标签向量分别为y1,y2,y3,...,yp,组成标签矩阵Y=[y1,y2,y3...yp],其中p为大于0的正整数;

S2:将标签矩阵转化成一个二进制的稀疏矩阵Y*

S3:采用快速聚类运算对Y*聚类成n个聚类分区,选取每一个聚类分区的聚类中心点作为代表点放入到矩阵R中,并保留图像数据集X中每一个原始图像数据对应的标签向量T作为代表点与图像数据集X中的原始图像数据的对应关系;

S4:利用矩阵R构建相似矩阵S,将相似矩阵S代入鲁棒集成谱聚类模型中得到目标函数,并对目标函数进行迭代优化运算;

S5:迭代优化直到最后目标函数收敛为止,将最后得到的目标函数中的标示矩阵H进行快速聚类运算,并保留聚类后每个聚类分区的聚类标签,得到标签矩阵P;

S6:将图像数据集X中的原始图像数据和标签矩阵P联系起来,并将迭代后的标示矩阵H聚类后聚类分区的代表点所代表的图像数据集X中的原始图像数据分配到S5中的聚类分区中,得到最后的聚类结果。

优选地,所述快速聚类算法为K-means聚类算法。

优选地,S4中利用矩阵R构建相似矩阵S的公式为:

优选地,S4中将相似矩阵S代入鲁棒集成谱聚类模型中得到可伸缩性鲁棒集成谱聚类模型目标函数的计算公式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910028637.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top