[发明专利]一种基于加权三角密度的稠密子图抽取方法在审
申请号: | 202010114785.0 | 申请日: | 2020-02-25 |
公开(公告)号: | CN111339374A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 王荣杰;王家兵 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G16B25/00;G16B40/00 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 加权 三角 密度 稠密 抽取 方法 | ||
本发明公开了一种基于加权三角密度的稠密子图抽取方法,包括步骤:S1、给定一个图数据,建立起图网络;S2、用三角形抽取算法将图网络中的三角形集合抽取出来;S3、根据应用场景对每个三角形进行合适的赋权,定义密度函数;S4、利用赋权好的三角形集合,建立起流网络;S5、利用二分法搜索合适的流网络参数;S6、计算流网络的S集和输入顶点集合交集,得到稠密子图。本发明能够从稀疏的图中,根据图的结构信息抽取出边密度高的子图,并且可以结合节点本身的信息,使得抽取出的子图不仅密度大并且符合应用场景要求,能够应用在蛋白质作用分析等图挖掘应用中。
技术领域
本发明涉及图网络数据挖掘的技术领域,尤其是指一种基于加权三角密度的稠密子图抽取方法。
背景技术
图是最常用的数据结构之一,用来表示实体之间错综复杂的关系。近年来,在应用领域和科研领域中产生了大量用图来建模和表示的数据,称为图数据。如社交网络、web网络、生物蛋白质网络等,这类数据往往规模大、关系复杂,难以分析。挖掘图数据中的有用知识已经成为一个重要的研究热点,简称图数据挖掘。其中,稠密子图发现是图数据挖掘中一个十分重要的问题。
给定一个图,稠密子图发现旨在图中挖掘出一个子图,使得子图中边的密度最大。这意味着,这个子图中的节点之间联系紧密。挖掘出联系紧密的子图,有助于我们理解和挖掘图中的有用信息。密度定义度量的只是稠密子图内部节点和边的特性,与密集子图外部的拓扑结构无关。最简单的寻找稠密子图的方法是最大团算法,然而最大团是NP难问题,具有很大的算法复杂度。因此,许多研究者,使用一些近似算法来寻找稠密子图。这些算法,在很多小图上能够搜索出密度高的子图,但是在一些稀疏的大规模图上,往往抽取出密度不高的子图。并且现有的稠密子图方法只关注在无权图上,而现实中的图挖掘场景往往是带权图,难以满足应用需要。
因此,找到一种性能更好并且能够充分图的结构信息和权重信息的算法,成为本领域一个亟待解决的问题。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于加权三角密度的稠密子图抽取方法,能够在稀疏的大规模图上抽取出密度高的子图,并且该方法不仅能够根据图的结构信息抽取出密度高的子图,还可以结合节点本身的信息,使得抽取出的子图不仅密度大并且符合应用场景要求。
为实现上述目的,本发明所提供的技术方案为:一种基于加权三角密度的稠密子图抽取方法,包括以下步骤:
S1、给定一个图数据,建立起图网络G=(V,E),其中V为输入图中的顶点集合,E为输入图中的边集合;
S2、用三角形抽取算法将图网络G=(V,E)中的三角形集合抽取出来;
S3、根据应用场景对每个三角形进行合适的赋权,定义密度函数;
S4、利用赋权好的三角形集合,建立起流网络;
S5、利用二分法搜索合适的流网络参数;
S6、计算流网络的S集和输入顶点集合交集,得到稠密子图。
在步骤S3中,对于每个三角形赋权,用w(ΔP)表示对顶点集合为P的三角形的赋权大小,基于赋权定义密度函数:
用来表示一个子图G1=(V1,E1)的密度,其中Z1是子图G1中的三角形集合,|V1|是子图G1中顶点集合V1的节点个数,E1为子图G1中的边集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010114785.0/2.html,转载请声明来源钻瓜专利网。