[发明专利]一种基于变量加权的软子空间聚类方法在审
| 申请号: | 202011337158.X | 申请日: | 2020-11-25 |
| 公开(公告)号: | CN112418325A | 公开(公告)日: | 2021-02-26 |
| 发明(设计)人: | 何国良;蒋文君 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 许莲英 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 变量 加权 空间 方法 | ||
1.一种基于变量加权的软子空间聚类方法,其特征在于,包括下列步骤:
步骤1,构建多元时间序列样本数据集;
步骤2,初始化变量权重矩阵以及多个聚类的中心;
步骤3,将多元时间序列样本数据集中所有样本,结合初始聚类中心划分为K个簇,并计算目标函数值;
步骤4,更新变量权重和聚类中心;
步骤5,重复步骤3-4,直至相邻两次迭代间目标函数的差值小于一定阈值,则输出最终聚类结果。
2.根据权利要求1所述的基于变量加权的软子空间聚类方法,其特征在于:
步骤1所述多元时间序列样本数据集为:
i=1,2,...,N
其中,l=1,2,...,L,d=1,2,...,D,Xi表示第i个多元时间序列样本,表示第i个多元时间序列样本中第l行观测值中第d个变量,N为多元时间序列样本的数量,D为多元时间序列样本中变量的数量,L为每个变量中观测值的数量。
3.根据权利要求1所述的基于变量加权的软子空间聚类方法,其特征在于:
步骤2所述变量权重矩阵为:
W=(wj,d)
j∈[1,K]
d∈[1,D]
其中,K表示簇的数量,D表示变量的数量,wj,d是表示第d个变量对于第j个簇的重要性;
设置所有变量权重为相同的值,即所有变量对所有簇的重要性相同,具体为:
wj,d=1/D
其中,j=1,2,...,K,d=1,2,...,D;
步骤2所述初始化多个聚类的中心为:
V1,V2,...,VK;K是聚类簇的数量,聚类中心均来自于真实的多元时间序列样本;
提出基于反近邻的密度峰值方法来寻找JV数据集X的峰值即初始聚类中心,该方法的主要思想是峰值相比周边具有高密度,同时距离其它峰值较远;
对于数据集X中每个样本Xi,分别计算其局部密度ρi和其与密度比它高的样本的最小距离δi,通过以上两个因素来判别一个样本是否是峰值(聚类中心);
所述计算多元时间序列样本的局部密度为:
ρi=|{Xp|Xi∈Nk(Xp),Xp∈X/Xi}|
其中,ρi为第i个计算多元时间序列样本的局部密度,Xi表示第i个多元时间序列样本,Nk{Xp)为第p个多元时间序列样本的k近邻样本,即距离第p个多元时间序列样本最近的k个样本,根据经验k=5;
当第i个多元时间序列样本是第p个多元时间序列样本的k近邻样本,则第p个多元时间序列样本是第i个多元时间序列样本的一个反近邻样本,则ρi定义为第i个多元时间序列样本的反最近邻样本的数量;
在多元时间序列样本数据集中,搜索局部密度大于第i个计算多元时间序列样本的局部密度对应的高局部密度多元时间序列样本;
计算第i个计算多元时间序列样本与高局部密度多元时间序列样本的最小距离δi,即
其中,Xp是多元时间序列样本数据集中局部密度比Xi高的多元时间序列样本,distm{Xi,Xp)是第i个多元时间序列样本与第p个多元时间序列样本之间的距离,通过基于形状的距离去进行计算;
表示样本Xi与样本Xp在第d个变量上的距离,分别是样本Xi和样本Xp的第d列的值,即:
所述基于形状的距离采用互相关去计算两个多元时间序列样本之间的距离,则和之间的互相关序列为:
其中,是一个长为2L-1的序列,表示在不同滑动窗口ω下的内积值,ω的取值范围为{1,2,...,2L-1},的具体计算如下:
用A,B分别代替ai+k表示A第i+k个值,bi表示B第i个值;
通过对进行标准化,得到:
其中,表示序列的模,表示序列的模;也是一个长为2L-1的序列;
之间基于形状的距离在最大值处ω计算得:
其中,表示取的最大值;
通过上述过程,已经对JV数据集中各个样本求得其局部密度ρi和其与密度比它高的样本的最小距离δi;
最后,选定前K大(ρi*δi)值的多元时间序列样本作为初始聚类中心即V1,V2,...,VK。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011337158.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种谷物烘干机的谷物输送机构用驱动轮
- 下一篇:一种仿猛禽变体翅膀





