[发明专利]一种面向全排列数据的多变量可视分析方法有效
| 申请号: | 201810860167.3 | 申请日: | 2018-08-01 |
| 公开(公告)号: | CN109271567B | 公开(公告)日: | 2022-07-26 |
| 发明(设计)人: | 孙国道;周志秀;赵银;刘义鹏;蒋莉;梁荣华 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F16/904 | 分类号: | G06F16/904;G06K9/62 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 排列 数据 多变 可视 分析 方法 | ||
1.一种面向全排列数据的多变量可视分析方法,其特征在于,所述方法包括以下步骤:
1)、对原始数据集合中的有限项目使用全排列算法得出所有排序方案;假设原始数据为一组集合,集合包含n个需要排列的项目item:S={item-1,item-2,item-3…item-n},对每个item设置id,然后全排列得出所有目的地的不同排序P={P1{1,2,3…n},P2{1,3,2…n},…,Pn!{n,n-1,n-2…1}},不同排序P中方案的数量为Sum=n!;
2)、根据原始数据中各个项目两两之间的连接属性,分别对上一步得到的排序方案添加其对应的连接属性信息;假设原始数据中项目之间连接的有三个属性分别用T,Q,D来表示,则排序方案{1,2,3…n}对应的连接属性向量为:
L1={T1-2,Q1-2,D1-2,T2-3,Q2-3,D2-3,T3-4,Q3-4,D3-4…T(n-1)-n,Q(n-1)-n,D(n-1)-n};
3)、通过MDS算法将所有排序方案降维聚类,在MDS算法构建特征向量的过程中,使用序列的排序信息和属性连接信息来构建特征向量;
4)、选择感兴趣序列以后,用可视化组件PCP View的平行坐标高亮展示感兴趣序列的属性信息,旅行数据展示的便是方案的总花费时间,价格,距离三个属性,不同方案,序列不同,连接属性不同,属性总和不同;
5)、可视化组件PCP View的矩阵视图高亮展示感兴趣序列的详细信息;采用n×n!矩阵的表现方式展示所有的全排列集合,n等于项目的数量,n!为全排列集合的数量;在矩阵中,每一列表示一个排序方案,排序方案从上至下由n个项目组成;采用不同颜色的小矩形来编码映射示不同的项目,通过不同颜色的矩形块在纵轴方向的不同分布来表示排序方案排序的不同;可视化组件PCP View视图就是由这些不同色块排列的排序方案组合而成一个巨大矩阵,展示所有的全排列方案,为用户提供关于所有排序方案的排序映射;采用焦点+上下文可视化交互技术,将用户感兴趣框选的序列详细信息一一焦点扩大,嵌入在原来的矩阵视图中,其他序列信息视图压缩;
6)、用户对感兴趣的序列展开,查看具体的连接属性,展开序列方案中的项目连接属性使用不同形状的图标表示,虚线连接,由上到下,映射属性值由小变大;用户通过展开序列,比较序列方案之间的差异性,选择符合自己要求的最佳序列方案。
2.如权利要求1所述的一种面向全排列数据的多变量可视分析方法,其特征在于,所述步骤3)中,在MDS算法计算相异度矩阵的过程中,使用Kendall tau距离和欧氏距离结合的方法,计算排列方案之间的相似度;排列方案1和排列方案2之间的相似度距离:
D=Kendall tau(W1,W2)+Euclidean(W1,W2)
通过相似度,将全排列的所有结果一一映射到二维空间,展示排列方案的聚类结果。
3.如权利要求2所述的一种面向全排列数据的多变量可视分析方法,其特征在于,所述步骤3)中,在散点图视图中,将全排列的所有结果一一映射到二维空间,当项目数量超过8个,对二维空间内的点选择性投影展示:通过DBSCAN算法,基于密度,确定集群数量以及核心点,然后分别对各个集群中的点,合并距离小于一定阈值或者重合的点。
4.如权利要求3所述的一种面向全排列数据的多变量可视分析方法,其特征在于,所述步骤3)中,对每个核心点对应的集群做了进一步的统计,通过设计的聚类字形图展现,核心点上的聚类字形设计由两个部分组成:内圈和外圈;内圈的圆的大小描绘了集群中排序方案的数量,内圆越大表示集群内排序方案的数量越多;外部扇形表示集群中某一个用户感兴趣的连接属性的统计分布,以便用户从聚类字形图中快速识别所有排序方案基于自身排序属性和连接属性通过MDS算法在二维平面投影后的集群模式,发现特殊集群或者感兴趣的集群。
5.如权利要求4所述的一种面向全排列数据的多变量可视分析方法,其特征在于,所述步骤3)中,外部扇形统计方法如下:
针对用户感兴趣的某个连接属性Lx,对原始集合S中的项目两两组合得到一组属性Lx的值{Lx12,Lx13,Lx14,…},对这组属性值取平均Lavg;全排列后的排列方案有n个项目组成,对应会产生n-1个Lx,通过多对n-1个Lx与Lavg比较,计算大于Lavg的Lx的个数,将此个数作为排列方案关于属性Lx的等级;在聚类集群中,对每个全排列方案关于某个兴趣属性通过上述方法评级,然后统计各个等级对应的全排列方案的数量;
外部扇形图的可视化编码如下:扇形从内圆12点位置顺时针分布,顺着逆时针方向的扇形表示排列方案关于某个兴趣属性的等级,扇形的长度表示对应等级的全排列方案的数量大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810860167.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种计算机数据处理系统
- 下一篇:应用于存储系统的节点视图展示方法及相关设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





