[发明专利]一种改进Dijkstra权重的社交网络抽样生成算法在审
| 申请号: | 201610166154.7 | 申请日: | 2016-03-22 |
| 公开(公告)号: | CN105631752A | 公开(公告)日: | 2016-06-01 |
| 发明(设计)人: | 杜景林;侯大俊;喻亚楠;周光胜 | 申请(专利权)人: | 南京信息工程大学 |
| 主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
| 代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 210019 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 改进 dijkstra 权重 社交 网络 抽样 生成 算法 | ||
技术领域
本发明涉及一种改进Dijkstra权重的社交网络抽样生成算法,属于社交网络拓扑 抽样生成算法技术领域。
背景技术
社交网络(如:Facebook、Twitter等)是网络用户用来分享信息,发布活动,相互 交流的一种Internet平台。社交网络中存在大量的网络用户,他们之间的交流包含着大量 的信息,目前对社交网络的研究分析越来越重要,但是社交网络中的关系错综复杂(如空手 道俱乐部网络和电子邮件网络等),直接分析原始网络会造成很大的负担。因此,我们需要 对复杂网络进行抽样,得到能够代表原网络的子网。目前,常用的抽样方法可分为三类:点 抽样法、边抽样法和拓扑结构抽样法。列举两种常用的抽样算法:随机选择节点算法 (RandomNodeSampling-RNS)和随机选择边算法(RandomEdgeSampling-RES)。RNS算法 是通过随机的选择复杂网络中的节点和与之相连的边,进行网络抽样,属于点抽样算法的 一种;RES算法是通过随机的选择一系列的边和与其相连的点,进行网络抽样,属于利用边 进行抽样的一种算法;另外还有一种随机漫步抽样算法(RandomWalkSampling-RWS)也很 常用,该算法先通过设立一个种子节点,下一步抽取与之相连的下一个节点,有更多边连接 的节点更容易被抽取。如采用RNS算法进行抽样,是通过抽取出满足抽样率的节点后停止抽 样,这可能会导致抽样出的子网中边的抽样率偏大或偏小。采用RES算法进行抽样,是通过 抽取出满足抽样率的边后停止抽样,这可能会导致抽样出的子网中节点的抽样率偏大或偏 小。采用RWS算法进行抽样,也可能会导致抽样出的子网中节点或边的抽样率偏大或偏小, 而且通过RWS抽样算法得到的子网,不能很好的代表整个图,只能代表种子节点附近的网 络。因此,急需一种算法能够改善这些问题,使得抽样出来的拓扑图形能够很好的代表原 图。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供一种改进Dijkstra权重 的社交网络抽样生成算法,是一种从全局角度出发结合网络拓扑图中节点之间的最短路径 和出现的频率综合抽样,既可以保证抽样出来的子网分布均匀,又可以保证抽样出来的子 网更加贴近原始网络。
为解决上述技术问题,本发明采用的技术方案如下:
一种改进Dijkstra权重的社交网络抽样生成算法,包括以下步骤:
1)根据给定的原始社交网络拓扑图形,采用中心度算法来求取节点之间的连接权 重;
2)在原始社交网络拓扑图形中随机选择l对不相邻的节点作为源节点和目的节 点,然后运用Dijkstra算法求出所选择的l对源节点和目的节点之间的最短路径,具体过程 包括:
假设原始社交网络拓扑图形G=<V,E>,其中V={p1,p2,…,pn}代表节点的集合, pi,i=1,2……n,表示第i个节点,n为节点的个数,E={e1,e2,…,em}代表边的集合,ei,i= 1,2……m,表示第i条边,m为边数,则源节点ps到目的节点pt之间的最短路径,步骤如下:
2-1)设定节点之间的连接权重作为连接节点之间的距离,计算出原始社交网络拓 扑图形中所有连接节点之间的距离的集合D,D={d1,d2,…,df},di代表原始社交网络拓扑 图形中节点之间的连接权重,f表示有f对连接节点;
2-2)比较源节点ps到相邻节点间的距离,抽取距离最小的节点pi;
2-3)比较节点pi到相邻节点间的距离,求出最小值dk,对应的相邻节点为pk;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610166154.7/2.html,转载请声明来源钻瓜专利网。





