[发明专利]一种大数据多视图图聚类方法在审
申请号: | 202110624636.3 | 申请日: | 2021-06-04 |
公开(公告)号: | CN113360732A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 康昭;林治平 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/901 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 视图 图聚类 方法 | ||
1.一种大数据多视图图聚类方法,其特征在于,该方法包括如下步骤:
步骤1:将给定数据集中的节点特征和节点关系一起转换为一个无向图G={v,E1,…,EV,X1,…,XV},其中代表给定数据集中的节点集合,表示第个视图节点之间关系的集合,代表了无向图G中图数据的节点数,表示了节点i与节点j在第个视图之中的联系,表示第个视图的节点特征,表示第个视图中第k个节点的特征取值,k=1,2,…,n;表示有第个视图有n个节点,每个节点的特征维度为d;无向图G采用多视图邻接矩阵表征,代表的第i行第j列数据,具体而言,当时,当时,由此获取第个视图的对称标准化邻接矩阵如下所示:
其中是第个视图对应的度矩阵,I为单位矩阵;
步骤2:通过步骤1所得到第个视图的对称标准化邻接矩阵结合现实世界中的信号特性,采用一个低通滤波器来阻断高频信号,通过该低通滤波器后得到第个视图节点特征的平滑表征表示为:
其中k表示该低通滤波器阶数,k是一个非负的整数,表示第个视图标准化的图拉普拉斯矩阵;
步骤3:对于单视图的自表达模型,其目标函数表示为:
其中,α0是一个预设的平衡参数,是参数矩阵,表示单视图节点特征的平滑表征,是步骤2中的单视图的形式表达,表示矩阵的转置,表示L2范数的平方,单视图的自表达模型的目标函数第一项表征的是自重建误差,第二项Θ(Z)是一个正则项,需要根据实际情况设置合适的正则项Θ(Z);
步骤4:第个视图的对称标准化邻接矩阵为稀疏矩阵,并且只表述了节点之间的一阶相似性,很难充分利用节点之间的潜藏信息,因此采用图的高阶邻近信息表示,图的高阶邻近信息表示如下:
f(A)=A+A2+…+AP
其中f(A)就是高阶邻近信息表示,A是的单视图表达,P为多项式阶数,且P是一个正整数;
步骤5:利用高阶邻近信息表示f(A),对单视图的自表达模型中的正则项进行改进,改进后得到单视图图聚类模型的目标函数,所述单视图图聚类模型的目标函数表示如下:
步骤6:重新构建矩阵以应用于大数据上,选取m个锚点组成一个锚点集也就是矩阵B,具体而言,采用基于节点重要性的采样策略来采样锚点并且定义这一映射关系,q表示给定数据集中节点和对应的节点重要性的映射关系,即为每一个节点对应一个重要性度量值,表示正实数集合;选择节点作为锚点集中的第一个锚点的概率定义如下:
其中,表示节点i的重要性度量值,表示所有未选择的节点的重要性度量值总和,其中γ为预设的采样参数且γ0;接着无重复地采样剩下的m-1个节点,任意一个节点都有的概率被选为第二个锚点,一直按照此规则,直到其中,表示节点集合中去掉已经选择的锚点集中的锚点的集合,分母是一个规范化因子,确保在每一步采样中
步骤7:根据步骤6的采样策略,将求解转换为求解并且将步骤6中的矩阵B扩展到每一个视图上,表示矩阵B在第个视图上的表征,得到基于锚点的单视图图聚类模型的目标函数:
其中是从中抽取m个与锚点集中的锚点对应的行组成的矩阵,表示L2范数的平方,表示第个视图的高阶邻近信息,是需要求解的参数矩阵;
步骤8:根据步骤7中基于锚点的单视图图聚类模型,进一步引入权重机制,将基于锚点的单视图图聚类模型扩展到基于锚点的多视图图聚类模型上去,基于锚点的多视图图聚类模型的目标函数表示为:
其中是第个视图的权重参数,w0是一个预设的平滑参数,表示第个视图节点特征的平滑表征;
步骤9:采取交替优化的优化方法,迭代求解基于锚点的多视图图聚类模型的目标函数中的参数矩阵S,具体优化步骤如下:
S1:初始化迭代次数t=0和随机初始化S,初始化
S2:采用步骤6中的基于节点重要性的采样策略得到矩阵
S3:循环执行S4-S5,直到∈为预先设定的收敛值;
S4:计算St如下所示:
其中I是单位矩阵;
S5:计算如下所示:
其中
最终得到参数矩阵S;
步骤10:根据步骤9得到的参数矩阵S,将作为谱聚类的输入得到最终的聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110624636.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:海底电缆的铺设方法及其装置
- 下一篇:密封式快速装取弹丸的包装筒及包装组件
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置