[发明专利]一种大数据多视图图聚类方法在审

专利信息
申请号: 202110624636.3 申请日: 2021-06-04
公开(公告)号: CN113360732A 公开(公告)日: 2021-09-07
发明(设计)人: 康昭;林治平 申请(专利权)人: 电子科技大学
主分类号: G06F16/906 分类号: G06F16/906;G06F16/901
代理公司: 电子科技大学专利中心 51203 代理人: 周刘英
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 视图 图聚类 方法
【权利要求书】:

1.一种大数据多视图图聚类方法,其特征在于,该方法包括如下步骤:

步骤1:将给定数据集中的节点特征和节点关系一起转换为一个无向图G={v,E1,…,EV,X1,…,XV},其中代表给定数据集中的节点集合,表示第个视图节点之间关系的集合,代表了无向图G中图数据的节点数,表示了节点i与节点j在第个视图之中的联系,表示第个视图的节点特征,表示第个视图中第k个节点的特征取值,k=1,2,…,n;表示有第个视图有n个节点,每个节点的特征维度为d;无向图G采用多视图邻接矩阵表征,代表的第i行第j列数据,具体而言,当时,当时,由此获取第个视图的对称标准化邻接矩阵如下所示:

其中是第个视图对应的度矩阵,I为单位矩阵;

步骤2:通过步骤1所得到第个视图的对称标准化邻接矩阵结合现实世界中的信号特性,采用一个低通滤波器来阻断高频信号,通过该低通滤波器后得到第个视图节点特征的平滑表征表示为:

其中k表示该低通滤波器阶数,k是一个非负的整数,表示第个视图标准化的图拉普拉斯矩阵;

步骤3:对于单视图的自表达模型,其目标函数表示为:

其中,α0是一个预设的平衡参数,是参数矩阵,表示单视图节点特征的平滑表征,是步骤2中的单视图的形式表达,表示矩阵的转置,表示L2范数的平方,单视图的自表达模型的目标函数第一项表征的是自重建误差,第二项Θ(Z)是一个正则项,需要根据实际情况设置合适的正则项Θ(Z);

步骤4:第个视图的对称标准化邻接矩阵为稀疏矩阵,并且只表述了节点之间的一阶相似性,很难充分利用节点之间的潜藏信息,因此采用图的高阶邻近信息表示,图的高阶邻近信息表示如下:

f(A)=A+A2+…+AP

其中f(A)就是高阶邻近信息表示,A是的单视图表达,P为多项式阶数,且P是一个正整数;

步骤5:利用高阶邻近信息表示f(A),对单视图的自表达模型中的正则项进行改进,改进后得到单视图图聚类模型的目标函数,所述单视图图聚类模型的目标函数表示如下:

步骤6:重新构建矩阵以应用于大数据上,选取m个锚点组成一个锚点集也就是矩阵B,具体而言,采用基于节点重要性的采样策略来采样锚点并且定义这一映射关系,q表示给定数据集中节点和对应的节点重要性的映射关系,即为每一个节点对应一个重要性度量值,表示正实数集合;选择节点作为锚点集中的第一个锚点的概率定义如下:

其中,表示节点i的重要性度量值,表示所有未选择的节点的重要性度量值总和,其中γ为预设的采样参数且γ0;接着无重复地采样剩下的m-1个节点,任意一个节点都有的概率被选为第二个锚点,一直按照此规则,直到其中,表示节点集合中去掉已经选择的锚点集中的锚点的集合,分母是一个规范化因子,确保在每一步采样中

步骤7:根据步骤6的采样策略,将求解转换为求解并且将步骤6中的矩阵B扩展到每一个视图上,表示矩阵B在第个视图上的表征,得到基于锚点的单视图图聚类模型的目标函数:

其中是从中抽取m个与锚点集中的锚点对应的行组成的矩阵,表示L2范数的平方,表示第个视图的高阶邻近信息,是需要求解的参数矩阵;

步骤8:根据步骤7中基于锚点的单视图图聚类模型,进一步引入权重机制,将基于锚点的单视图图聚类模型扩展到基于锚点的多视图图聚类模型上去,基于锚点的多视图图聚类模型的目标函数表示为:

其中是第个视图的权重参数,w0是一个预设的平滑参数,表示第个视图节点特征的平滑表征;

步骤9:采取交替优化的优化方法,迭代求解基于锚点的多视图图聚类模型的目标函数中的参数矩阵S,具体优化步骤如下:

S1:初始化迭代次数t=0和随机初始化S,初始化

S2:采用步骤6中的基于节点重要性的采样策略得到矩阵

S3:循环执行S4-S5,直到∈为预先设定的收敛值;

S4:计算St如下所示:

其中I是单位矩阵;

S5:计算如下所示:

其中

最终得到参数矩阵S;

步骤10:根据步骤9得到的参数矩阵S,将作为谱聚类的输入得到最终的聚类结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110624636.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top