[发明专利]一种基于PCA-Radviz的三维数据可视化方法有效
申请号: | 201910440105.1 | 申请日: | 2019-05-24 |
公开(公告)号: | CN110162568B | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 殷晶晶 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06K9/62 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 陈玲玉;梅洪玉 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于PCA‑Radviz的三维数据可视化方法,其步骤为:1)对原始数据进行标准化处理;2)将处理后的数据进行主成分分析(PCA),得到以贡献度最大的两维向量为x、y轴构成的平面;3)分别求出数据原始维度与x、y轴的余弦距离,得到原始维度在该平面上投影的角度与向量长度;4)利用上一步骤中得到的角度为Radviz圆周设计合理的维度锚点布局;5)将数据样本以圆点模式投影到Radviz单位圆内部;6)扩展z轴,将二维平面点拉至三维立体中。本发明基于PCA‑Radviz对集中不同类别数据样本的数据进行展示,不但为用户提供了尽可能多的数据聚类信息,而且达到了更好的数据可视化效果,从而使用户进行更加快速、直观、准确的决策。 | ||
搜索关键词: | 一种 基于 pca radviz 三维 数据 可视化 方法 | ||
【主权项】:
1.一种基于PCA‑Radviz的三维数据可视化方法,其特征在于,所述的方法包括以下步骤:步骤1)对原始数据进行标准化处理,得到标准化矩阵M;步骤1.1)计算样本数据的均值μ及标准差σ,计算公式为:![]()
其中,xi为第i个样本数据,N为样本数据的个数;步骤1.2)根据步骤1.1)得到的均值μ及标准差σ,计算标准化处理后的转化函数,经过标准化处理的数据符合标准正态分布,即均值为0,标准差为1;标准化处理后的数据变化范围为‑1≤x*≤1;所述的标准化处理数据公式为:
其中,x*为标准化处理后的数据;步骤2)根据步骤1)得到的标准化矩阵M,进行主成分分析;步骤2.1)通过主成分分析计算标准化矩阵M的协方差矩阵Cov(Xi,Xj),然后得到协方差矩阵的特征值λ={λ1,λ2,...,λk}和特征向量C=(c1,c2,...,ck);步骤2.2)依据特征值大小对特征向量进行降序排序,给出成分的重要性级别;步骤2.3)选择重要性级别最高的两个特征向量组成平面L,即第一个新坐标轴选取原始数据中方差最大的方向作为x轴,第二个新坐标轴选取与第一个新坐标轴正交的平面内所有方向中方差最大的方向作为y轴;步骤3)根据步骤2)得到的平面L,分别求出原始数据各维度与x、y轴的余弦距离cosθi1和cosθi2,得到原始数据各维度在该平面L上投影的角度与向量长度,即构成原始数据各维度在平面L上的投影坐标(xi,yi);所述的余弦距离cosθi1和cosθi2的计算公式为:![]()
式(4)‑(5)中,θi1为原始数据各维度在x轴上投影的角度,θi2为原始数据各维度在y轴上投影的角度,
为原始数据维度,
为x轴向量,
为y轴向量;步骤4)根据步骤3)得到的投影坐标(xi,yi),利用步骤3)中得到的投影的角度为Radviz圆周设计合理的维度锚点布局;将步骤3)中得到的向量长度进行压缩,角度不变,计算得到Radviz维度锚点在Radviz圆周上的位置
步骤5)根据步骤4)得到的Radviz维度锚点在Radviz圆周上的位置,将所有原始数据的数据点在Radviz维度锚点的弹簧拉力作用下投影到Radviz内部,弹簧拉力大小正比于数据点在每一维度上的维度值;并根据数据分类或聚类结果对数据点进行不同颜色的着色;步骤6)根据步骤5)得到的Radviz在二维平面上的可视化效果,将原始数据点到原点的欧拉距离作为z轴的数值,将二维平面点拉至三维立体中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910440105.1/,转载请声明来源钻瓜专利网。