[发明专利]一种大数据多视图图聚类方法在审

专利信息
申请号: 202110624636.3 申请日: 2021-06-04
公开(公告)号: CN113360732A 公开(公告)日: 2021-09-07
发明(设计)人: 康昭;林治平 申请(专利权)人: 电子科技大学
主分类号: G06F16/906 分类号: G06F16/906;G06F16/901
代理公司: 电子科技大学专利中心 51203 代理人: 周刘英
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 视图 图聚类 方法
【说明书】:

发明公开了一种大数据多视图图聚类方法,采用低通滤波器得到每一个视图特征的平滑表示,将表现良好的自表达模型与锚点思想结合,选取具有代表性的锚点替代原始数据,降低时间复杂度的同时高效地学得图邻接矩阵,通过设置正则项和权重机制得到可迅速收敛的算法,通过该算法得到最优表示的图邻接矩阵,将谱聚类技术运用于学得的图邻接矩阵得到最终的聚类结果。本发明通用性强,基于锚点技术将时间复杂度降为数据个数的线性时间复杂度,基于图结构矩阵的高阶邻近信息、图滤波技术、权重机制,能够高效地捕捉多视图图数据中的潜在信息,相较于基于深度学习的方法,本发明在计算效率上大大提升,并且性能指标不弱于基于深度学习的方法。

技术领域

本发明属于图数据聚类领域,具体涉及一种大数据多视图图聚类方法。

背景技术

随着图类数据的大小和范围的增长,基于图的机器学习方法引起了人们的兴趣。图聚类是无监督学习的一个分支,其目的是将图中的节点划分为若干不相交的组,使每个组属于一个类。图聚类在群体检测、群体分割等方面表现出显著的性能。在实际应用中,实际数据往往比较复杂,既包括节点属性,也包括不同顶点之间的结构关系。为了从结构和特征中挖掘出丰富的信息,有人采用了一种图嵌入框架,有人提出了一种联合聚类技术,并且开发了一种关系主题方法来解决这个问题。然而,它们主要集中在稀疏的原始图上,不能有效地利用底层信息。此外,这些方法无法处理多视图数据,并且由于时间复杂度较高,很难应用于大数据上。

现在,大多数图类数据通常是多模态和多关系的。换言之,节点由多个特征矩阵组成,每个节点通过多种关系相互作用。以学术网络为例,一个图形视图代表合著论文关系,另一个视图描述合著者关系;作者本身也具有研究领域、引文、代表词等多重特征。从不同的角度充分利用互补信息是可取的。

基于上述调研,我们可以得出结论,设计一种大数据多视图图聚类方法具有很大的实际运用价值。为此,本发明提出了一种大数据多视图图聚类方法,它有四个不同的特性:首先,它具有足够的通用性,既可以处理具有多个特征属性和单个图的数据,也可以处理具有单个特征属性和多个图的数据。第二,本发明提出的方法基于低通滤波技术,能够通过近期取得巨大成功的图神经网络得到平滑的特征表示,实现简单的同时保证了对图结构的充分利用,训练参数较少。第三,它能够探索图的高阶邻近信息关系。这些使得我们的方法在实际应用中具有很大潜力。第四,本发明借助了采样策略和锚点的思想,能大大降低算法的时间复杂度,可以在线性时间复杂度内完成任务。

发明内容

本发明提出了一种大数据多视图图聚类方法,步骤1是对对多视图图数据进行预处理,设定好模型参数区间,步骤2-9执行多视图图聚类算法,步骤10对参数矩阵执行非负对称化处理,执行谱聚类算法得到聚类结果。具体而言,包括以下步骤:

步骤1:将给定数据集中的节点特征和节点关系一起转换为一个无向图其中代表给定数据集中的节点集合,Ev表示第v个视图节点之间关系的集合,v=1,2,…,V,一共有V个视图,其中代表了无向图G中图数据的节点数,表示了节点i与节点j在第v个视图之中的联系,表示第v个视图之中的节点特征,其中,表示第v个视图中第k个节点的特征取值,k=1,2,…,n;表示第v个视图有n个节点,每个节点的特征维度为d。无向图G可以被多视图邻接矩阵所表征,代表的第i行第j列数据,具体而言,当时,当时,由此我们可以获取第v个视图的对称标准化邻接矩阵如下所示:

其中Dv是第v个视图对应的度矩阵,I为单位矩阵。

步骤2:通过步骤1所得到第v个视图的对称标准化邻接矩阵Av,结合现实世界中的信号一般都是平滑的特性,以及近期取得巨大成功的图神经网络主要是依托于低通滤波器,本发明基于图卷积思想构造出一个低通滤波器来阻断高频信号,通过该低通滤波器后的第v个视图节点的特征矩阵(即通过该低通滤波器后的第v个视图节点特征的平滑表征)可以表示为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110624636.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top