[发明专利]一种低空间开销的大规模图中三角形计数方法及系统在审
| 申请号: | 202010920564.2 | 申请日: | 2020-09-04 |
| 公开(公告)号: | CN112131444A | 公开(公告)日: | 2020-12-25 |
| 发明(设计)人: | 肖侬;牟者斌;卢宇彤;陈志广 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/901 |
| 代理公司: | 深圳市创富知识产权代理有限公司 44367 | 代理人: | 李思坪 |
| 地址: | 510275 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 空间 开销 大规模 三角形 计数 方法 系统 | ||
1.一种低空间开销的大规模图中三角形计数方法,其特征在于,包括以下步骤:
获取数据集并根据数据集构建有向图,得到图数据;
遍历图数据中的所有顶点并将顶点按预设规则放入预设的布隆筛;
根据图数据中的边得到该边对应的两个顶点;
判断到这两个顶点存在于布隆筛中,计算这两个顶点的邻居顶点集合的交集,得到该边对应三角形的数量。
2.根据权利要求1所述一种低空间开销的大规模图中三角形计数方法,其特征在于,还包括:
遍历图数据中所有的边并得到所有边对应参与构成三角形的数量;
将所有边对应参与构成三角形的数进行加和,得到图数据的三角形总数量。
3.根据权利要求2所述一种低空间开销的大规模图中三角形计数方法,其特征在于,所述获取数据集并根据数据集构建有向图,得到图数据这一步骤,其具体包括:
获取数据集并将数据集重新组织成有序的边集数组;
根据边集数组构建大小为顶点数量并储存有索引信息的索引数组;
根据边集数组和索引数组得到图数据。
4.根据权利要求3所述一种低空间开销的大规模图中三角形计数方法,其特征在于,所述遍历图数据中的所有顶点并将顶点按预设规则放入预设的布隆筛这一步骤,其具体包括:
依次遍历图中所有的顶点并将该顶点的邻居顶点中所有不相同的两顶点构成顶点对;
将顶点对按照顶点编号小的在前、大的在后的形式加入布隆筛中。
5.根据权利要求4所述一种低空间开销的大规模图中三角形计数方法,其特征在于,所述预设的布隆筛具体通过图数据中的顶点数量构建,其表达式如下:
上式中,k为哈希函数个数,m为布隆过滤器长度,n为插入的元素个数,p为误报率。
6.根据权利要求5所述一种低空间开销的大规模图中三角形计数方法,其特征在于,所述根据图数据中的边得到该边对应的两个顶点这一步骤还包括将该边对应的两个顶点按顶点编号从小至大的顺序将这两个顶点排序。
7.根据权利要求6所述一种低空间开销的大规模图中三角形计数方法,其特征在于,所述计算这两个顶点的邻居顶点集合的交集,其具体包括:
判断到两个顶点的邻居顶点集合的大小比值小于预设值,采用同时遍历两个顶点的邻居顶点集对比元素取交集的方法,得到这两个顶点的邻居顶点集合的交集;
判断到两个顶点的邻居顶点集合的大小比值大于预设值,先遍历元素数较小的集合并依次将其在元素数较多的集合中进行二分查找,计算得到这两个顶点的邻居顶点集合的交集。
8.一种低空间开销的大规模图中三角形计数系统,其特征在于,包括以下模块:
图数据模块,用于获取数据集并根据数据集构建有向图,得到图数据;
放入模块,用于遍历图数据中的所有顶点并将顶点按预设规则放入预设的布隆筛;
顶点模块,用于根据图数据中的边得到该边对应的两个顶点;
交集模块,用于判断到这两个顶点存在于布隆筛中,计算这两个顶点的邻居顶点集合的交集,得到该边对应三角形的数量。
9.根据权利要求8所述一种低空间开销的大规模图中三角形计数系统,其特征在于,还包括:
遍历模块,用于遍历图数据中所有的边并得到所有边对应参与构成三角形的数量;
加和模块,用于将所有边对应参与构成三角形的数进行加和,得到图数据的三角形总数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010920564.2/1.html,转载请声明来源钻瓜专利网。





