[发明专利]一种基于属性图的并行图摘要方法在审

专利信息
申请号: 201910783949.6 申请日: 2019-08-23
公开(公告)号: CN110598055A 公开(公告)日: 2019-12-20
发明(设计)人: 马应龙;张鹏 申请(专利权)人: 华北电力大学
主分类号: G06F16/901 分类号: G06F16/901;G06F16/904
代理公司: 11246 北京众合诚成知识产权代理有限公司 代理人: 史双元
地址: 102206 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 候选节点 合并 直接邻居节点 节点结构 两节 预处理 最大相似度 计算机图 节点处理 节点信息 邻居节点 邻居信息 剩余节点 随机选择 摘要技术 最终节点 并行图 属性图 图数据 导出 保存 返回 引入 重复 更新
【说明书】:

发明属于计算机图摘要技术领域,尤其涉及一种基于属性图的并行图摘要方法,包括:步骤1:对获取的图数据进行预处理,将图中每个节点处理成具有自己本身信息和所有直接邻居信息的节点结构;步骤2:对当前节点随机选择一个直接邻居节点,然后在该邻居节点的所有直接邻居节点中选择与当前节点具有相同属性和最大相似度的节点作为和当前节点一起合并的候选节点;步骤3:判断当前节点与候选节点合并后引入误差是否超过误差阈值,若超过则返回步骤2继续寻找其他候选节点,若没超过,则合并两节点;步骤4:通过更新节点结构中的所有节点信息来执行两节点合并,并重复步骤3~4直到剩余节点数量小于设定阈值,保存最终节点结构并导出摘要图。

技术领域

本发明属于计算机图摘要技术领域,尤其涉及一种基于属性图的并行图摘要方法。

背景技术

图具有强大的内在优势,被广泛应用于现实对象及其关系的建模。大规模的图形数据在许多应用领域都很常见。在图中,实体被建模为顶点,而它们的关系或连接则由边表示。各种现代应用产生了大量的图数据,由于图中编码存储了大量的关系信息,可以从这些图数据中能够挖掘出潜在的隐式知识,从而更好的用于服务用户,因此许多研究者都对图数据的处理计算做了深入的研究。然而,随着应用用户数量的不断增长,图的规模和结构的日益复杂,分析和处理具有数百万甚至数十亿个节点和边的大型图成为一个巨大的挑战。因为图数据的数量和复杂性极高,常规的图数据分析工具无法在有限的时间内完成对图数据的挖掘分析。因此,无论对于工具或算法来说,将大规模的图归纳为简洁、信息丰富、高度抽象原始图的表示方式,降低图数据的规模和复杂性,通过这些方式可以很容易地存储、管理、分析和处理大规模图数据,这成为现如今一个至关重要的需求。在各种图计算技术中,图摘要是解决这些问题的一种潜在方法。

在图摘要研究领域,不同的研究群体所关注的主体有所不同,他们往往也从不同的角度提取图的特征,因此产生了众多的图摘要算法。现有的图摘要算法大多采用统计学的方法来研究和提取图的特征,主要关注的是图的拓扑结构,例如节点度分布、频繁子图挖掘、社区检测等。但是,这个算法生成的摘要往往是一系列的图,它们只是原始图中的出现频率较高或者结构比较密集的子图,通过主要结构代替整个图来近似地得到摘要图。虽然它们在很大程度上包含了原始图的主要信息,可以代替原始图进行分析和处理,但是它们往往忽视了图中的其他信息,造成整个图结构信息失去直观性,可能导致分析结果的偏差,甚至是错误。大多数算法只考虑图的拓扑结构,并没有考虑节点属性和关系信息,然而大多数现实世界中的网络图都是属性图,其节点和边具有多种属性和关系,只考虑图的拓扑结构不符合实际情况的要求。除此之外,现有的大多数方法都是在单机环境下进行图摘要,随着互联网用户的急剧增加,图的规模往往超过单台计算机的计算和存储能力,当节点和边缘达到百万或十亿个数量级时,这些算法无法正常处理这些大规模图,扩展性不高。基于单机环境的集中式图摘要算法不再适合现在的处理环境,研究和实现基于分布式环境的并行图摘要算法对未来的大规模图数据的分析和处理起到了至关重要的作用。

在以往节点对合的研究中,存在两种节点选择策略:贪心方法和随机方法。贪心方法是每次都在全图中选择最优的2跳邻居节点对进行合并,虽然它选择了最佳的节点对进行合并,并得到最小的摘要误差,但它造成了大量的计算和网络通信。随机方法是每次随机选择2跳邻居节点对作为候选节点对,虽然大大较少节点对选择阶段的计算量,但选取的节点对在很大概率上不满足节点合并的误差阈值,造成了后续阶段不必要的计算。

发明内容

针对上述技术问题,本发明提出了一种基于属性图的并行图摘要方法,包括:

步骤1:对获取的图数据进行预处理,将图中每个节点处理成具有自己本身信息和所有直接邻居信息的节点结构;

步骤2:对当前节点随机选择一个直接邻居节点,然后在该邻居节点的所有直接邻居节点中选择与当前节点具有相同属性和最大相似度的节点作为和当前节点一起合并的候选节点;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910783949.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top