[发明专利]基于半懒惰学习的图流链路预测方法在审
| 申请号: | 201710205511.0 | 申请日: | 2017-03-31 |
| 公开(公告)号: | CN107018020A | 公开(公告)日: | 2017-08-04 |
| 发明(设计)人: | 谷峪;辛秉哲;李芳芳;于戈 | 申请(专利权)人: | 东北大学 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/721;H04L12/751;G06Q10/04;G06Q50/00 |
| 代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙)21234 | 代理人: | 俞鲁江 |
| 地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 懒惰 学习 图流链路 预测 方法 | ||
1.一种基于半懒惰学习的图流链路预测方法,其特征在于,包括以下步骤:
步骤1:将图流中到达的顶点进行哈希映射;
步骤2:为每个顶点建立动态接收不断到达顶点的哈希值存储池;
步骤3:为两两顶点建立保存动态参数变化的矩阵,并计算共同邻居评分值;
步骤4:快速的两两顶点的共同邻居评分值计算方法;
步骤5:两两顶点的偏斜采样的共同邻居评分计算方法。
2.根据权利要求1所述的一种基于半懒惰学习的图流链路预测方法,其特征在于:
步骤1中:将图流中到达的顶点进行哈希映射;为了便于计算,算法首先设计了一个哈希算法:H:u∈V→[0,1];输入顶点u,输出一个0到1的数作为顶点u的哈希值,每个顶点对应唯一的值。
3.根据权利要求1所述的基于半懒惰学习的图流链路预测方法,其特征在于:
步骤2中:为每个顶点建立动态接收不断到达顶点的哈希值存储池包括设计了邻接矩阵池用来存储在Δt=|Tx-Ty|时间段内接受到的边的数据,其中Tx-Ty表示时间戳Tx到Ty的时间段;由于边序列是大致是按照时间的顺序到达的,所以当有新边到达时并且其时间戳大于Tx-Ty的范围后,Δt=|Tx-Ty|进行更新,Ty变成最新的边的时间戳,Tx变成Ty-Γ,Γ>0,Γ为设置的时间间隔,Γ根据数据集不同而设置成不同的值。
4.根据权利要求1所述的一种基于半懒惰学习的图流链路预测方法,其特征在于:
步骤3中:为两两顶点建立保存动态参数变化的矩阵,表示两个顶点u和v之间的关系的动态变化的参数,称作活跃权重wuv(t),具体情形如下:
wu,v(0)=0,Δ=1,Φ=0.5(2)
式(1)edge(u,v)∈G(t)表示顶点u与v之间在时刻t存在连边;
步骤3-1:将权重wuv(t)的变化分为四种情形,第一种为顶点u的邻接顶点哈希值存储池r(u)中有的新的邻接顶点哈希值h(v)到达,这两个顶点之间的权重更新为wuv(t)+Δ,第二种情形h(v)在r(u)中两个顶点之间的权重更新为wuv(t)+Δ,第三种情形为r(u)将h(v)删除此时,此时两顶点的权重更新为Φ·wuv(t),第四种情形为h(v)不在r(u)中,此时两顶点的权重更新为Φ·wuv(t);
步骤3-2:当需要在线的计算两顶点相似性得分时只需比较每个顶点的共同邻居哈希值存储池的相同个数来计算两顶点的共同邻居的评分值,计算公式为:
CNuv={i|i∈r(u)∩r(v)}(4)
其中wu,i,wv,i分别表示顶点u与顶点i,顶点v与顶点i的活跃权重;α,β控制着wu,v(t)与CNuv对得分贡献所占的比重,α、β值应根据网络的不同而设置不同的值,CNuv表示顶点u的邻接顶点池r(u)与顶点v的邻接顶点池r(v)的交集。
5.根据权利要求1所述的一种基于半懒惰学习的图流链路预测方法,其特征在于:
步骤4中:快速的两两顶点的共同邻居评分值计算方法包括两个部分:
步骤4-1:构建排序的顶点哈希值存储池来接收到达的顶点哈希值,给定一个图流数据G(t),对数据中的每条边的两个顶点u和v,如果u没有邻接顶点池则为其生成,并将v的哈希值h(v)插入u的邻接顶点池中;如果顶点u有邻接顶点池,将v的哈希值h(v)插入到u的邻接顶点池中的适当位置,其中邻接顶点池按照哈希值的大小从小到大进行排序;
步骤4-2:为了找出两个顶点的共同邻居,为步骤4-1中的有序的邻接顶点哈希值存储池设立游标Curv,Curv指向存储池r(v0)的头部;当两个游标指向的哈希值相同时记录下来共同的顶点,两个游标一起指向下一个顶点哈希值,当两个游标指向的哈希值不相等时,指向值较小的游标指向下一个哈希值接着进行比较,直至其中一个游标遍历完哈希值存储池步骤计算完两个顶点的共同邻居之后,便可以按照步骤3-2中所述的评价公式计算两个顶点的共同邻居得分。
6.根据权利要求1所述的一种基于半懒惰学习的图流链路预测方法,其特征在于:
步骤5中:两两顶点的偏斜采样的共同邻居评分计算方法可以分为四个部分,
步骤5-1:为了方便采样,对顶点集V中的每个顶点建立一个邻接顶点池r(i),i∈V,并获取r(i)的长度li,并将li添加到邻接顶点池的长度集L中;从L中选出可以作为拐点的值ld,将顶点分成V1={v∈V|lv≥ld},V2={v∈V|lv<ld},其中lv为v的邻接顶点池的长度,也就是长度的大小的两个集合;
步骤5-2:对于V1中的顶点,顶点之间的共同邻居计算采用等比抽样,可得估计的共同邻居值为p为采样率;
步骤5-3:当两个顶点都是集合V2中的顶点,由于其邻接顶点电池并不会很大,因此顶点之间的共同邻居可由共同邻居计算公式计算,即得分为CNuv=|r(u)∩r(v)|u,v∈V2
步骤5-3:对于顶点u∈V1,v∈V2采用不等比例采样估计;采样率p等于顶点v的邻接顶点集的大小lv与顶点u的邻接顶点集大小lu的比值即从顶点u的邻接顶点集r(u)中取出与顶点v的邻接顶点集大小相等的采样集,通过求这两个集合的交集来达到进行非等比例采样的目的;r(u)与r(v)分别表示顶点u和v的邻接顶点集的总体,则顶点顶点u和v的共同邻居估计值CNuv为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710205511.0/1.html,转载请声明来源钻瓜专利网。





