[发明专利]一种基于降维窗口的主成分分析方法及系统在审
| 申请号: | 201810885037.5 | 申请日: | 2018-08-06 |
| 公开(公告)号: | CN109241367A | 公开(公告)日: | 2019-01-18 |
| 发明(设计)人: | 张瑞;杜韬;曲守宁;许婧文;王玉栋;武奎 | 申请(专利权)人: | 济南大学 |
| 主分类号: | G06F16/904 | 分类号: | G06F16/904 |
| 代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 刘雪萍 |
| 地址: | 250022 山东省济南市市中区*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 降维 系数矩阵 主成分分析 窗口参数 结束条件 待处理数据 输入数据集 大小排列 降维处理 结果数据 宽度优化 初始化 无变化 行元素 返回 溢出 输出 优化 | ||
本发明提供一种基于降维窗口的主成分分析方法及系统,包括如下步骤:1.输入待处理数据集X;S2.初始化降维窗口参数e和结束条件参数a;3.根据输入数据集X计算得到初始相关系数矩阵B;4.根据初始相关系数矩阵B计算得到相关系数矩阵P;5.根据相关系数矩阵P判断是否符合结束条件;若是,进入步骤6;若否,进入步骤7;6.输出降维结果数据集X`;7.为相关系数矩阵P添加降维窗口,并将相关系数矩阵P每行元素按大小排列;8.判断是否出现窗口溢出,或者,出现窗口宽度优化后无变化;若是,进入步骤9;若否,进入步骤10;9.优化降维窗口参数;返回步骤7;10.在降维窗口内对数据进行降维处理;返回步骤3。
技术领域
本发明属于数据分析处理领域,具体涉及一种基于降维窗口的主成分分析方法及系统。
背景技术
当今世界正处于基于信息技术的第三次工业革命中,同时人类社会也步入大数据时代,信息技术高速发展,数据呈爆发式的增长态势,越来越多的企业、科研单位、政府看到了大数据中蕴藏的巨大财富,数据挖掘技术以及机器学习成为当下入门的研究领域,面对通过技术手段收集的未处理的巨量原始数据,直接对其进行挖掘分析既浪费时间、浪费硬件资源,结果也不一定准确,因为这些数据中会存在很大程度的冗余信息、噪声、错误数据等,我们需要在进行数据挖掘或者学习之前对原始数据进行一个预处理,对冗余数据的清理,目前也已经发展出各种降维算法如主成分分析(PCA),基于核函数的主成分分析(KPCA),针对稀疏矩阵的鲁棒主成分分析(RPCA)等,它们在线性降维、非线性降维以及去噪提高鲁棒性等方面都有良好的性能,但都存在一个问题,就是降维后数据映射到另一空间内,通过聚类和分类的结果失去了原空间的信息,对人们分析结果带来困难,而且数据返映射也很困难。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,在原数据空间尽量保留主要信息的基础上直接降维,提供一种基于降维窗口的主成分分析方法及系统,是非常有必要的。
发明内容
本发明的目的在于,针对上述现有主成分分析算法的降维结果失去原数据空间结构,可能改变原数据空间信息以及分析结果不便于人工理解的缺陷,提供一种基于降维窗口的主成分分析方法及系统,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
一种基于降维窗口的主成分分析方法,包括如下步骤:
S1.输入待处理数据集X;
S2.初始化降维窗口参数e和结束条件参数a;
S3.根据输入数据集X计算得到初始相关系数矩阵B;
S4.根据初始相关系数矩阵B计算得到相关系数矩阵P;
S5.根据相关系数矩阵P判断是否符合结束条件;
若是,进入步骤S6;
若否,进入步骤S7;
S6.输出降维结果数据集X`;
S7.为相关系数矩阵P添加降维窗口,并将相关系数矩阵P每行元素按大小排列;
S8.判断是否出现窗口溢出,或者,出现窗口宽度优化后无变化;
若是,进入步骤S9;
若否,进入步骤S10;
S9.优化降维窗口参数;返回步骤S7;
S10.在降维窗口内对数据进行降维处理;返回步骤S3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810885037.5/2.html,转载请声明来源钻瓜专利网。





