[发明专利]一种基于标签传播概率的并行图划分方法在审
申请号: | 201910212049.6 | 申请日: | 2019-03-20 |
公开(公告)号: | CN109960750A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 季雅雯 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/958;H04L12/803;H04L29/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 近年来,随着计算机网络的飞速发展,Web上的RDF数据量飞速增长,特别是出现了很多大规模的RDF数据集,与传统关系数据相比,RDF数据是一种典型的无模式数据且富含文本信息,这些特征也导致难以根据结构信息优化存储。本发明将复杂的网络关系划分为内部紧密联系的社区结构,从而合理地将大规模数据集进行划分及存储。本发明基于标签传播社区划分算法进行优化,针对标签传播顺序,采用顶点影响力排序的方式,选取一定种子数量分配标签开始进行传播,减少了一些不必要的计算代价并提升了划分的准确率;又结合分布式环境,对于需要反复迭代计算的过程提高了运算效率。通过上述方式,本发明能够有效地提高图划分的准确性,并提升了划分运算效率。 | ||
搜索关键词: | 标签 运算效率 传播 大规模数据集 反复迭代计算 分布式环境 传统关系 结构信息 模式数据 社区结构 数量分配 网络关系 文本信息 优化存储 并行图 有效地 准确率 富含 算法 计算机网络 排序 存储 概率 社区 优化 | ||
【主权项】:
1.一种大数据下一种基于标签传播概率的的并行社区发现方法。其特点在于,针对分布式环境对传统标签传播算法进行改进,采用顶点影响力排序的方式,选取一定种子数量分配标签开始进行传播,传播过程计算传播概率,并对所采用的方法在Spark GraphX中进行了整体的实现。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910212049.6/,转载请声明来源钻瓜专利网。