[发明专利]一种基于变量加权的软子空间聚类方法在审
| 申请号: | 202011337158.X | 申请日: | 2020-11-25 |
| 公开(公告)号: | CN112418325A | 公开(公告)日: | 2021-02-26 |
| 发明(设计)人: | 何国良;蒋文君 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 许莲英 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 变量 加权 空间 方法 | ||
本发明提出了一种基于变量加权的软子空间聚类方法,解决了多元时间序列数据的聚类问题,消除了多元时间序列间冗余或相关变量的影响。本发明为不同变量分别分配一个权重向量,代表其对各个簇形成的重要性。为高效计算两个多元时间序列之间的距离,首先引入基于形状的距离度量方法。其次,该算法将变量权重嵌入基于形状的距离度量的目标函数中。然后优化目标函数,通过不同的更新策略对聚类结果,变量权重和聚类中心分别进行迭代更新,直到收敛后得到最终的聚类结果。提出一种基于反近邻的密度峰值学习算法来选取该软子空间聚类算法的初始聚类中心。通过对真实的多元时间序列数据进行实验,其实验结果证实了本发明所提算法的有效性和准确性。
技术领域
本发明涉及多元时间序列的数据挖掘技术领域,尤其涉及一种基于变量加权的软子空间聚类方法。
背景技术
大量多元时间序列数据出现在各个领域,如:生物学,医疗和金融等,因此多元时间序列数据挖掘受到广泛的关注。其中,聚类作为数据挖掘中的重要技术,多元时间序列聚类也吸引了很多研究者的关注,并在过去的十几年里产生了一些相关的研究成果。
多元时间序列聚类主要可以分为两类:基于原始数据的方法和基于数据降维后的方法。对于基于原始数据的方法,Li等学者结合动态时间规整和基于形状的距离两种距离度量方法,提出了基于特征加权的聚类方法。Zhou等学者将多元时间序列变量之间的关系转换为用多关系网络来表示,并使用多非负矩阵分解来得到聚类结果。对于基于数据降维的方法,Li等人和He等人均采用了主成分分析方法对多元时间序列数据进行降维。不同的是,前者基于变量维度对数据进行降维,后者基于时间维度对数据进行降维。
对于基于原始数据的方法,当遇到高维的数据时,这些方法往往耗费大量的时间,且聚类效果也会受到影响。为解决这一问题,基于子空间的聚类方法被广泛提出。在现实应用中,由于变量之间的相关性,不同簇内的样本往往只与部分变量(特征)相关。子空间聚类方法分为:硬子空间聚类和软子空间聚类。硬子空间聚类方法的思想是去除无关和冗余的变量,对处理后的数据进行聚类,所以也包含部分基于数据降维的方法。软子空间聚类方法又包含两种情况。一种情况下,所有簇共享一个变量子空间:给每个变量分配一个权重值,所有变量的权重相加为一。另一种情况下,不同簇存在不同的变量子空间:给每个变量分配一个权重向量,即每个变量对不同簇的形成的重要性。由于硬子空间聚类方法容易丢失一些原始信息,软子空间聚类方法更适用于实际应用。目前,软子空间聚类的方法大多基于k-means类型的方法,使用和传统k-means类似的方法去优化一个基于距离度量的目标函数。Jia等人和Hashemzadeh等人提出的目标函数都是基于最小化各个簇内样本间的距离。
然而,传统的子空间聚类方法存在以下问题:
基于多元时间序列数据高维度和多变量的特点,传统的子空间聚类方法均不适用于多元时间序列聚类。
到目前为止,很少有研究工作考虑多元时间序列变量之间的相关性和冗余性,缺乏对多元时间序列进行软子空间聚类的研究。
大多数基于k-means类型的软子空间方法存在着初始聚类中心敏感的问题。
发明内容
为了克服上述现有技术的不足,本发明提供了一种针对多元时间序列数据的基于变量加权的软子空间聚类方法。
本发明的技术方案为一种基于变量加权的软子空间聚类方法,包括下列步骤:
步骤1,构建多元时间序列样本数据集;
步骤2,初始化变量权重矩阵以及多个聚类的中心。
步骤3,将多元时间序列样本数据集中所有样本,结合初始聚类中心划分为K个簇,并计算目标函数值;
步骤4,更新变量权重和聚类中心;
步骤5,重复步骤3-4,直至相邻两次迭代间目标函数的差值小于一定阈值,则输出最终聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011337158.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种谷物烘干机的谷物输送机构用驱动轮
- 下一篇:一种仿猛禽变体翅膀





