[发明专利]一种基于降维窗口的主成分分析方法及系统在审
| 申请号: | 201810885037.5 | 申请日: | 2018-08-06 |
| 公开(公告)号: | CN109241367A | 公开(公告)日: | 2019-01-18 |
| 发明(设计)人: | 张瑞;杜韬;曲守宁;许婧文;王玉栋;武奎 | 申请(专利权)人: | 济南大学 |
| 主分类号: | G06F16/904 | 分类号: | G06F16/904 |
| 代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 刘雪萍 |
| 地址: | 250022 山东省济南市市中区*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 降维 系数矩阵 主成分分析 窗口参数 结束条件 待处理数据 输入数据集 大小排列 降维处理 结果数据 宽度优化 初始化 无变化 行元素 返回 溢出 输出 优化 | ||
1.一种基于降维窗口的主成分分析方法,其特征在于,包括如下步骤:
S1.输入待处理数据集X;
S2.初始化降维窗口参数e和结束条件参数a;
S3.根据输入数据集X计算得到初始相关系数矩阵B;
S4.根据初始相关系数矩阵B计算得到相关系数矩阵P;
S5.根据相关系数矩阵P判断是否符合结束条件;
若是,进入步骤S6;
若否,进入步骤S7;
S6.输出降维结果数据集X`;
S7.为相关系数矩阵P添加降维窗口,并将相关系数矩阵P每行元素按大小排列;
S8.判断是否出现窗口溢出,或者,出现窗口宽度优化后无变化;
若是,进入步骤S9;
若否,进入步骤S10;
S9.优化降维窗口参数;返回步骤S7;
S10.在降维窗口内对数据进行降维处理;返回步骤S3。
2.如权利要求1所述的一种基于降维窗口的主成分分析方法,其特征在于,步骤S1中输入的待处理数据集构成n维m个对象的矩阵X=[x1,x2,……,xn],其中xi是m维的属性向量,1≤i≤n。
3.如权利要求2所述的一种基于降维窗口的主成分分析方法,其特征在于,步骤S3的具体步骤如下:
S31.根据待处理数据集X=[x1,x2,……,xn],得到属性向量方差D(xi)和D(xj),1≤i,j≤n;
S32.根据待处理数据集X=[x1,x2,……,xn],得到两个属性向量的协方差Cov(xi,xj);
S33.根据随机变量之间的相关系数公式得到初始相关系数矩阵B,B中元素用bij表示,
4.如权利要求1所述的一种基于降维窗口的主成分分析方法,其特征在于,步骤S4的具体步骤如下:
S41.将初始相关系数矩阵B减去跟B同阶的单位方阵E,得到B`=B-E;
S42.将矩阵B`的所有元素取绝对值得相关系数矩阵P。
5.如权利要求1所述的一种基于降维窗口的主成分分析方法,其特征在于,S5具体步骤如下:
S51.计算相关系数矩阵P各行元素的和,并取出其中的最大值与最小值做差得到差值d;
S52.根据结束条件End_con=a*(b_max-b_min)判断d是否小于End_con,其中b_max和b_min分别表示初始时P矩阵对每行的元素进行求和后,其中的最大值和最小值,0.01≤a≤0.1;
若是,进入步骤S6;
若否,进入步骤S7。
6.如权利要求1所述的一种基于降维窗口的主成分分析方法,其特征在于,步骤S7具体步骤如下:
S71.在相关系数矩阵P右侧添加降维窗口Widthwin=floor(n*e),其中n表示数据维数,e为降维窗口参数,floor()是一个MATLAB函数,用来做向上取整运算,当两个参数相乘不为整数时,其值去掉小数部分加一即为函数值,窗口高度即维数;
S72.将相关系数矩阵P每行元素按值的大小升序排列;
S73.相关系数矩阵重新排列后对属性重新编号。
7.如权利要求6所述的一种基于降维窗口的主成分分析方法,其特征在于,步骤S10具体步骤如下:
S101.统计在窗口内的有序元素对应的属性号出现的次数;
S102.按统计序号出现的次数升序将属性号进行排序;
S103.将值最大的前Width_win个属性从原数据集中去掉。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810885037.5/1.html,转载请声明来源钻瓜专利网。





