[发明专利]一种基于多图的连通分量增量计算方法在审
申请号: | 202210357034.0 | 申请日: | 2022-03-31 |
公开(公告)号: | CN115051936A | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 李常宝;高泽;李云鹏;潘爽;袁媛;刘忠麟;赵静 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所 |
主分类号: | H04L43/0811 | 分类号: | H04L43/0811;G06F16/215;G06F16/22;G06F16/23 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 代丽 |
地址: | 100083 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 连通 分量 增量 计算方法 | ||
本发明公开了一种基于多图的连通分量增量计算方法,通过对连通分量进行重新编号,连接形成一张图,再进行计算得到新的连通分量,实现合并含有相同点的不同图后再进行连通分量的计算,解决了在合并图时,需要重新计算连通分量,导致计算时间长、效率低的问题。
技术领域
本发明属于计算机网络流量分析技术领域,具体涉及一种基于多图的连通分量增量计算方法。
背景技术
在网络流量分析过程中,依据大规模流量数据分析网络数据时,在解决不同来源的网络数据的网络归属判断问题以及由网络实效性带来的节点变化问题时,往往需要重新计算连通分量。
在分析网络数据时,对于不同渠道、不同设备获取的网络数据,在需要判断其是否属于同一网络时间时需要经过详细的数据分析,计算连通性时往往无法获得完备的网络归属,所以当判断两组网络数据属于同一物理网络时,需要重新计算连通分量。此时,通常采用的方法是获取所有符合条件的协议数据重新进行计算,然而重新计算会极大地耗费空间和时间资源。
此外,由于网络连通性具有时效性,当原网络数据中的某些节点发生改变时,连通性往往会随之改变,尤其是发生了网络地址重新分配时连通性也会改变。此时,如果需要获取新的连通数据,往往需要去除掉网络状况更改之前的数据,对于这种情况,通常采用的方法是获取所有符合条件的协议数据重新进行计算,同样会耗费大量的时间,造成了资源的浪费。
综上所述,针对上述两种场景,现有技术均是通过获取所有符合条件的协议数据再重新进行计算的方式得到连通性,且此类计算都属于全量计算,这会极大的耗费空间和时间资源。
发明内容
有鉴于此,本发明提供了一种基于多图的连通分量增量计算方法,实现了将现有的连通分量数据进行合并得到新图后再计算得到新的连通分量。
本发明提供的一种基于多图的连通分量增量计算方法,包括以下步骤:
收集现有的连通分量ID形成连通分量集合,且不同图ID所包含的连通分量的ID均不相同;对所述连通分量集合进行聚合操作,将所有连通分量ID对应的图ID收集起来,形成(compontID,Set(图ID));令Set(图ID)中只有一条数据的节点与自身连接形成自连接的边,令Set(图ID)中具有多条数据的节点彼此互联形成互联的边,由此形成新图;对所述新图进行连通分量计算得到Ip与新连通分量ID的数据对。
进一步地,所述对所述连通分量集合进行聚合操作的方式为采用大数据处理框架Spark的reduceByKey方法实现。
进一步地,在所述对所述新图进行连通分量计算得到Ip与新连通分量ID的数据对后,将Ip与新连通分量ID的数据对存储为(IP,新连通分量ID,新图ID)。
进一步地,所述将Ip与新连通分量ID的数据对存储为(IP,新连通分量ID,新图ID)的过程为分成时间阶段进行存储,即先计算所述时间阶段内的连通分量,再对连通分量进行合并后计算全部数据的连通分量。
进一步地,所述时间阶段为一周。
有益效果:
1、本发明通过对连通分量进行重新编号,连接形成一张图,再进行计算得到新的连通分量,实现合并含有相同点的不同图后再进行连通分量的计算,解决了在合并图时,需要重新计算连通分量,导致计算时间长、效率低的问题。
2、本发明通过记录设定时间内的连通分量数据,实现在需要去除某些冗余数据时,将其时间的数据进行合并计算,避免了重新获取所有边再计算,减小了单次计算的时间以及空间占用,使得在去除冗余数据时更加方便、效率。
具体实施方式
下面列举实施例,对本发明进行详细描述。
本发明涉及以下定义及方法:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所,未经中国电子科技集团公司第十五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210357034.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蜂窝夹芯树脂基复合材料的成型方法
- 下一篇:一种抗菌塑料制作方法