[发明专利]基于改进PCA的云计算网络中高维数据可视化方法有效
申请号: | 201610682672.4 | 申请日: | 2016-08-17 |
公开(公告)号: | CN106339354B | 公开(公告)日: | 2018-11-20 |
发明(设计)人: | 顾爱华;李树军 | 申请(专利权)人: | 盐城师范学院 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 南京先科专利代理事务所(普通合伙) 32285 | 代理人: | 叶帅东 |
地址: | 224002 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于改进PCA的云计算网络中高维数据可视化方法,对云计算网络中高维数据进行标准化处理;包括高维数据特征矩阵的组建和基于高维数据可视化的数据标准化处理优化两部分;在对高维数据可视化过程中,将原始高维数据矩阵中的变量进行标准化处理,给出新的高维数据特征矩阵,将矩阵中的特征值按顺序进行排列,选取方差最大的主成分数据;基于高维数据可视化的数据标准化处理优化中综合考虑主成分贡献率因素和列间的相似度,提出了新的数据列排序方。仿真结果表明,改进方法具有较好的可视化和分类效果,可以很好的实现云计算网络中高维数据标准化处理。 | ||
搜索关键词: | 基于 改进 pca 计算 网络 中高 数据 可视化 方法 | ||
【主权项】:
1.一种基于改进PCA的云计算网络中高维数据可视化方法,其特征在于:对云计算网络中高维数据进行标准化处理优化;包括高维数据特征矩阵的组建和基于高维数据可视化的数据标准化处理优化两部分;高维数据特征矩阵的组建在对高维数据可视化过程中,将原始高维数据矩阵中的变量进行标准化处理,给出新的高维数据特征矩阵,将矩阵中的特征值按顺序进行排列,选取方差最大的主成分数据;基于高维数据可视化的数据标准化处理优化综合考虑主成分贡献率因素和列间的相似度,提出了新的数据列排序方法;高维数据特征矩阵的组建,具体的步骤如下详述:由
代表云计算网络下原始数据矩阵,将X代表的各变量进行标准化预处理,利用式(5)获取标准化数据矩阵Z
式中,xi,j代表第i个高维数据的第j个类别属性,
代表第i个高维数据的协方差矩阵,
代表第i个高维数据的低维嵌入空间;则利用式(6)和式(7)计算出![]()
![]()
由C代表协方差矩阵,则利用式(8)计算出C
利用雅可比法得到C的特征值矩阵Λ=diag(λ1,λ2,...λm)和特征向量W;将各个数据的特征值依据从大到小顺序排列λ1>λ2>…>λm,并对特征向量列的顺序进行相应的调整,促使第一个主成分具有最大的方差,促使第二个主成分具有次大的方差,而将最小的方差对应第d个主成分;选取方差最大的k个主成分,并促使k个主成分能够保留大部分的原始信息;由wi代表选择的k个主成分的特征向量,则利用式(11)得到k个独立的线性组合新变量:
基于高维数据可视化的数据标准化处理优化,主要过程如下:由Y代表主成分转换后的数据矩阵,以获取的ξk为依据,利用式(12)计算出Y
式中,FC代表不同类别数据的类间分离度,G代表高维空间聚类数据,ω*代表类内聚集度;(1)贡献度因子计算首先计算得到的列间的相似度矩阵为
对于相似度矩阵S中的一元素Sij表示第i列与第j列的相似度;则对于第i列,和其他所有列的平均相似度为
Ti可以反映第i列和其他列的相似程度,因此可以定义新的贡献度因子为
ai代表贡献度因子权值,该贡献度因子由主成分贡献率因素和列间的相似度的乘积得到,可以更好地反映各列的重要性程度;(2)数据排序对gi代表的贡献度因子依据从大到小的顺序排列,而且要相应的调整其对应在Y中列的顺序,由Y′代表调整顺序后的矩阵,则利用式(14)进行表述
从式(14)中可以表述出,贡献率越大,Y中的数据列在Y′中所对应的数据列排序越靠前,则在可视化呈现中显示顺序越靠前;(3)数据列权重将Y′的每一列的权重大小定义为贡献率,并将Y′每一列与对应的贡献率相乘,则利用式(15)表述
由λnew代表新的数据贡献率,利用式(16)计算λnew中任意两行i,j间的距离
式中,D(i,j)代表未加入贡献率因素前i,j的距离。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盐城师范学院,未经盐城师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610682672.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种三七饮片及其制备方法
- 下一篇:一种增强免疫力的保健品及其制备方法