[发明专利]一种基于增量PCA的工业监测数据分类方法有效
申请号: | 201811091469.5 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109324595B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 谢国;张永艳;刘涵;王文卿;梁莉莉;张春丽;孙澜澜 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G05B23/02 | 分类号: | G05B23/02 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 杨洲 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 增量 pca 工业 监测 数据 分类 方法 | ||
本发明公开了一种基于增量PCA的工业监测数据分类方法,包括如下步骤:步骤1、对工业监测数据进行采集,按采样顺序排列,并记录其数据标签,将其分为训练集和测试集;步骤2、基于增量PCA方法建立模型,分别对步骤1中的训练集和测试集进行在线降维;步骤3、步骤2中的训练集作为数据对象建立支持向量机SVM分类模型,并通过对测试集数据进行分类验证该模型。本发明分别通过建立降维模型和传统的SVM分类模型,可对有标签的高维数据进行分类;该方法在保证计算量的同时,通过寻找最优超平面,对线性数据和非线性数据都可以进行二分类;可将其用于工业系统的故障检测,从而及时反映机器性能,能够采取相应措施,避免一系安全事故。
技术领域
本发明属于工业监测数据分类的技术领域,具体涉及一种基于增量PCA的工业监测数据分类方法。
背景技术
由于工业经济在我国的迅速发展,随之产生的数据呈指数级增长。不可避免地,在大量的工业数据中会存在冗余数据,这将给数据分析及后续计算带来很大的困难。如果,可以对高维数据进行降维即数据压缩,在对高维数据压缩的同时对其提取有效信息,这将给数据分析带来很大的便利。但是在现有降维方法中,主要针对的对象是离线数据,而对于不断更新的在线数据,离线降维方法是无法对更新的监测数据进行有效压缩。
发明内容
为解决上述问题,提出了一种基于增量PCA(Principal Component Analysis)的工业监测数据分类方法。该方法可实时对有标签的工业监测数据进行有效分类,相对于未降维的高维数据减小了计算量,是一种有效的数据分类方法,且对于线性数据和非线性数据都适用。
本发明采用以下技术方案:一种基于增量PCA的工业监测数据分类方法,包括如下步骤:
步骤1、对工业监测数据进行采集,按采样顺序排列,并记录其数据标签,将其分为训练集和测试集;
步骤2、基于增量PCA方法建立模型,分别对步骤1中的训练集和测试集进行在线降维;
步骤3、步骤2中的训练集作为数据对象建立支持向量机SVM分类模型,并通过对测试集数据进行分类验证该模型。
作为本发明进一步的方案,所述步骤1具体包括如下步骤:
步骤1.1、对工业系统中的传感器进行数据采样,假设采样数据为有标签数据,采集到的工业监测高维数据用X={x1,x2,…,xN}∈Rd×N表示,其中d表示高维数据的维数,每间隔1S进行一次采样,N表示采样数据的数目,第t个采样数据用xt表示,t∈{1,2,...,N},xt=[xt1 xt2 … xtd]T;
步骤1.2、对采样数据进行分配,采样数据的标签信息用Y={y1,y2,…,yN}∈R1×N表示,与高维数据X一一对应,选取高维数据X和数据标签Y的前百分之八十作为训练数据集和训练标签,剩下百分之二十作为测试数据集和测试标签。
作为本发明进一步的方案,所述步骤2包括如下步骤:
步骤2.1、输入高维数据X和所需参数:离线降维目标维数k<d,在线降维目标维数l<k,w0=0;
步骤2.2、对矩阵U、矩阵Z以及各参数进行初始化:矩阵U和Z为U=0d×l,Z=0d×l,w=0,wU=0l×1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811091469.5/2.html,转载请声明来源钻瓜专利网。