[发明专利]一种融合特征学习的自适应快速K-means聚类方法在审
申请号: | 201910209441.5 | 申请日: | 2019-03-19 |
公开(公告)号: | CN109978042A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 王晓栋;严菲;曾志强;陈玉明;洪朝群 | 申请(专利权)人: | 厦门理工学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 泉州市潭思专利代理事务所(普通合伙) 35221 | 代理人: | 麻艳 |
地址: | 361024 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种融合特征学习的自适应快速K‑means聚类方法,首先对数据进行预处理,排除其中属性缺失、数据重复问题,对各数据属性进行归一化处理;计算数据总散度矩阵,并引入稀疏特性构造特征选择矩阵;在特征子空间上执行K‑means聚类方法,且在聚类中心更新过程中,引入自适应因子动态调节每个数据样本权重;根据聚类间的可区分信息,更新特征选择矩阵,进而筛选出最优特征子集。此种方法使得传统K‑means聚类方法能够高效地利用聚类间和聚类内的可区分信息、以及特征之间的相关性信息提高聚类的准确度,还在聚类过程中融入自适应因子,根据不同类型数据分布的特点更新聚类中心,具备较高的实用性及可扩展性,可为机器学习、计算机视觉等相关应用提供有效支持。 | ||
搜索关键词: | 聚类 自适应 矩阵 聚类中心 区分信息 特征学习 最优特征子集 预处理 归一化处理 计算机视觉 特征子空间 动态调节 更新过程 构造特征 机器学习 计算数据 聚类过程 可扩展性 数据分布 数据属性 数据样本 数据重复 特征选择 稀疏特性 应用提供 有效支持 准确度 融合 引入 更新 权重 散度 筛选 融入 | ||
【主权项】:
1.一种融合特征学习的自适应快速K‑means聚类方法,其特征在于包括如下步骤:步骤1,对待处理数据进行预处理,并对各数据属性进行归一化处理,进而获得n组包括D个特征的无标签数据X=[x1,x2,…,xn]∈RD×n,其中xi∈RD×1表示第i个数据样本,i=1,2,…,n;计算数据总散度矩阵St;步骤2,设定待选择的子特征数d,类别数c,平衡因子λ和自适应因子σ,初始化权重矩阵Δ为单位矩阵,并随机初始化特征选择矩阵W和聚类中心矩阵G,其中G=[g1,g2,…,gc]∈Rd×c,gk表示第k个聚类中心向量,k=1,2,…,c;步骤3,建立聚类模型如下:
其中,F=[f1,f2,…,fn]T∈{0,1}n×c为类别标签矩阵,fi表示第i个数据样本的类别标签,i=1,2,…,n;以上模型的最优解等同于:
其中,
设定Δ=diag(τ1,τ2,…,τn)为一个对角矩阵,且U=[u1,u2,…,un]T=XTW‑FGT,则最终目标函数转化为:
步骤4,求解以上目标函数,直至满足结束条件,输出特征选择矩阵W,聚类中心矩阵G及类别标签矩阵F。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门理工学院,未经厦门理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910209441.5/,转载请声明来源钻瓜专利网。