[发明专利]面向大规模多元网络数据的简化可视分析方法有效
申请号: | 202110535193.0 | 申请日: | 2021-05-17 |
公开(公告)号: | CN113392332B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 周志光;张汝敏;胡淼鑫;刘玉华;王毅刚 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/957;G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱亚冠 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 大规模 多元 网络 数据 简化 可视 分析 方法 | ||
1.面向大规模多元网络数据的简化可视分析方法,其特征在于,该方法具体是:
步骤(1)基于原始网络大规模数据,构建属性增强的网络表征学习模型,将节点转换成嵌入拓扑结构和属性信息的高维向量表示;具体是:
(1-1)构建基于属性相似性的语料库:
将节点之间的属性相似度进行量化,如果相邻节点拥有同一个类别时,则其相似性sim(vi,vi,k′)设置为1,否则设置为0;vi,k′为游走初始节点vi的第k′个相邻节点,k′∈(1,K),K为vi的相邻节点的数量;跳转概率
以节点vi的前w的节点vi-w为起始点,vi-w基于属性相似性的游走rw(vi-w)=(vi-w,…,vi-1,vi,vi+1,…,vi+w),在当前游走路径中的最后一个节点的邻居中均匀地采样,直到达到最大游走步长L,L=2w+1;
以其他节点为初始节点的游走路径采用相同方式生成,所有节点都要作为初始节点进行基于属性相似性的游走;
(1-2)以固定的次数T重复遍历节点,以固定的游走步长L生成以每个节点开始的游走路径,创建各个属性的所有游走路径组成的语料库;
由多个属性生成的语料构成一个复合语料库minimizeφ(-logPr({vi-w,…,vi+w}/vi|φ(vi))),作为Skip-Gram模型的输入;其中φ(vi)表示vi向量、Pr({vi-w,…,vi+w}/vi|φ(vi))表示节点vi上下文出现vi-w到vi+w的概率;Skip-Gram模型使得到的向量能最大化从vi推测出其上下文vi-w到vi+w的概率,得到节点的高维向量表示;
步骤(2)利用属性增强的网络表征学习模型构建多层次聚类模型,在向量化空间中根据结构紧密度、属性同质性和聚类数量将节点划分为层次类别;具体是:
(2-1)将得到的节点的高维向量投影到一个二维空间,将k均值应用于投影向量对节点进行k-means聚类,利用层次聚类方法生成层次聚类结构,即对成对的聚类进行迭代合并,直到剩下一个聚类为止;
(2-2)使用三个度量标准指导层次结构的切割,分别是:结构紧密度、属性同质性、聚类数量;
设定多目标函数E(C)=w1Esc(C)+w2Eah(C)+w3Estr(C);其中,从多元网络生成的聚类集合C={C1,C2,…,Ck}是层次结构的一部分,具有一组叶子结点,Ck″为第k″组叶子结点,k″=1,2,…,k;w1、w2、w3为调整参数,用来平衡度量;
结构紧密度函数Esc(C)=1-density(C);
其中,聚类密度表示由C派生的聚类的结构紧密度;聚类密度越大,结构紧密度越小;
属性同质性函数其中,N为属性的数量,为Cm的属性ax上的信息熵,信息熵越低,聚类的节点属性越均匀;平均熵值越小的聚类成为叶子结点的概率越高;
聚类数量其中,dis(Cx,root)表示层次结构中Cx和初始点root之间的距离,表示与Cx其后代叶子结点之间的平均距离,p为Cx中所有后代叶子结点之一;
步骤(3)设计简化表达可视分析方案,构建大规模多元网络数据的简化可视分析系统;所述的简化可视分析系统通过聚类视图、协同视图构成视觉表达;
所述的聚类视图是采用glyph嵌入的网络图来提供多元图的简化表达,使用力引导模型对叶子结点进行布局,每个叶子结点的聚类都使用glyph进行可视化,有相似属性的节点被聚集到一个聚类中;
所述的协同视图是提供一组协同视图帮助用户直观地探索多元图的聚类,利用传统的降维模型t-SNE将高维向量投影到二维空间;对于每个节点,在其周围半径内找到其相邻节点,然后计算这些节点在多个属性上的信息熵,将熵值的倒数作为该点的权重,参与核密度的计算,从而确定热图的最终绘制;投影视图与树图通过交互连接,以在不同层次上探索聚类;在顶部采用河流图来可视化多目标函数值随着用户的交互而变化的过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110535193.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种动力电池管理装置
- 下一篇:基于低功耗蓝牙的地下配电室定位方法