[发明专利]一种基于LE算法的工业监测数据聚类方法在审
| 申请号: | 201811097330.1 | 申请日: | 2018-09-19 |
| 公开(公告)号: | CN109409407A | 公开(公告)日: | 2019-03-01 |
| 发明(设计)人: | 谢国;张永艳;刘涵;王文卿;梁莉莉;张春丽;孙澜澜 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 杨洲 |
| 地址: | 710048*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 聚类 数据聚类 算法 采样数据 工业监测 低维 建模 降维 预处理 输出 工业系统 监测数据 密度聚类 多变量 计算量 聚类簇 映射 高维 集合 采集 压缩 保证 发现 | ||
1.一种基于LE算法的工业监测数据聚类方法,其特征在于,包括如下步骤:
步骤1、对工业系统的监测数据进行采集,并进行预处理;
步骤2、基于拉普拉斯特征映射LE算法进行建模,将步骤1中的采样数据作为输入数据,通过计算并输出低维数据;
步骤3、基于密度聚类方法DBSCAN进行建模,步骤2的低维数据作为该模型的输入,对其进行聚类;
步骤4、输出:聚类后的集合C={C1,C2,…,CK},Co,o=1,2,...,K为聚类之后的第o个聚类簇。
2.根据权利要求1所述的一种基于LE算法的工业监测数据聚类方法,其特征在于,所述步骤1具体包括如下步骤:
步骤1.1、先对工业系统进行采样,并用X={x1,x2,…,xN}∈Rd×N表示,其中d表示数据的变量个数,N表示采样数目,其中第t个采样数据用xt表示,且t=1,2,...,N,xt=[xt1 xt2... xtd]T;
步骤1.2、对采样数据X进行检查,如果在X中某个数据xtj出现丢失现象,假设其中xtj为第t个采样数据的第j个变量丢失,则利用公式进行补充,j=1,2,…,d。
3.根据权利要求2所述的一种基于LE算法的工业监测数据聚类方法,其特征在于,所述步骤2具体包括如下步骤:
步骤2.1、将完整的步骤1的采样数据X作为输入,低维数据的维数s<d作为输入参数;
步骤2.2、构建一个邻接图G(V,E):用K最近邻算法KNN寻找属于每个数据点xt的k个近邻点,满足k<N;
步骤2.3、确定权值矩阵:如果数据点xt是数据点xi的近邻点,它的权值系数l表示热核函数的参数,对于不属于该数据点的近邻点,则将权重系数设置为零;
步骤2.4、计算对角矩阵D,该矩阵的对角线元素Dii由步骤2.3构建的权值矩阵的第i列所有元素Wti的和,用公式表示为除对角线元素外其余元素全部置零;
步骤2.5、计算拉普拉斯矩阵L:根据公式L=D-W计算拉普拉斯矩阵;
步骤2.6、通过解决广义特征值问题,根据公式Ly=λDy解决该问题并获得特征值及其特征向量,并提取最小的s个非零特征值及对应的特征向量,对应的低维数据输出用Y={y1,y2,…,ym}表示,其中yj为对应的第j个特征向量,j=1,2,…,m。
4.根据权利要求3所述的一种基于LE算法的工业监测数据聚类方法,其特征在于,所述步骤3具体包括如下步骤:
步骤2中产生的降维数据用Y={y1,y2,…,ym}表示,其中yj为N维向量,对降维后的N个采样数据进行聚类,聚类的目的是将相似性较大的数据聚成一类,相似性较小的数据分开;
步骤3.1、输入参数ε和MinPts,分别为聚类半径和除噪声点数据之外的每类数据中的最小数目;
步骤3.2、寻找核心对象:找出每个数据点在ε半径内的数据点,如果该半径内的数据点的个数大于等于MinPts时,标记该点为核心对象,反之,为噪声点数据;
步骤3.3、以步骤2中的所有核心对象为出发点,找出其密度可达样本生成的聚类簇,直到所以核心对象都被访问停止迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811097330.1/1.html,转载请声明来源钻瓜专利网。





