[发明专利]一种适用于社会网络图的数据存储方法及系统有效
申请号: | 201310279445.3 | 申请日: | 2013-07-04 |
公开(公告)号: | CN103345508A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 曲直;薛继龙;杨智;代亚非 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 冯艺东 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 社会 网络图 数据 存储 方法 系统 | ||
1.一种适用于社会网络图的数据存储方法,其步骤包括:
1)以边表或邻接表形式读取社会网络图的图结构信息;
2)根据所述图结构信息,将一个顶点v分裂为至多k个子顶点{v′1,v′2...v′k},每个子顶点拥有该顶点的所有顶点数据和相应的边上的数据,并满足:
其中,为顶点v的邻居顶点;
3)对于图中尚未分配到分区中的每一条边,先尝试将其分配到一个分区中,此时不产生跨分区的边;若该分配不成功,则产生一条跨分区的边。
2.如权利要求1所述的方法,其特征在于:采用DHT技术索引和定位顶点的位置。
3.如权利要求1所述的方法,其特征在于,在所有N个分区P={p1,p2...pn}中,设顶点v的当前所在分区集合为P(v);对于图中尚未分配到分区中的每一条边e=<u,v>,从一个分区子集中取出一个负载最轻的分区进行放置,对于p′的取值依次匹配如下规则,当有一条规则成功匹配时,停止处理之后的所有规则:
若则P′=P;
1)若则P′=P(u);
2)若则P′=P(v);
3)若则P′=Puv;
4)若P′=P(u)∪P(v),对于得到的计算结果t:
a)若|P(v)|<k,则添加顶点v到t中,P(v)=P(v)∪{t},
b)若|P(u)|<k,则添加顶点u到t中,P(u)=P(u)∪{t}。
4.如权利要求3所述的方法,其特征在于,若没有匹配成功,则产生一条跨分区的边,并按照如下规则进行匹配:
1)设u′和v′分别为顶点u和v的一个子顶点,Sub(u)为u当前的子顶点集,若存在u′∈Sub(u),且其中X(u′)为u′当前已有割边所在分区集合,则将边分配到u′和任意v′∈C;
2)否则,从两个顶点所在分区集合中各取一割边最小的分区,将其中的两个顶点连接。
5.如权利要求1所述的方法,其特征在于:所述k的值为2~5。
6.一种适用于社会网络图的数据存储系统,其特征在于,包括:
若干管理节点,同一时刻只有一个管理节点处于工作状态,其他节点处于备份态,所述管理节点包含:图结构管理器,负责实时响应外来图结构的变化,并对新到来的边进行分配操作;集群管理器,负责维护工作节点的基本配置和元数据信息;
若干工作节点,每个工作节点包含:DHT索引,负责定位和维护顶点相关的索引;图结构存储器,负责维护一个或多个分区的图结构;请求处理器,负责处理外部请求;数据库接口,负责与不同的底层数据库进行交互;
ZooKeeper集群,负责维护集群的一致性视图。
7.如权利要求6所述的系统,其特征在于,所述底层数据库采用下列存储方式中的一种:内存存储、单机数据库存储、分布式Key-value数据库存储。
8.如权利要求7所述的系统,其特征在于:采用MemCached进行所述内存存储,采用MySQL进行所述单机数据库存储,采用HBase进行所述分布式Key-value数据库存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310279445.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置