[发明专利]一种在线社交网络中有影响力传播者识别与量化的方法在审

专利信息
申请号: 201711165911.X 申请日: 2017-11-21
公开(公告)号: CN107945036A 公开(公告)日: 2018-04-20
发明(设计)人: 胡延庆;贾寒;孙嘉辰;谢家荣;刘荣 申请(专利权)人: 中山大学
主分类号: G06Q50/00 分类号: G06Q50/00;G06F17/30
代理公司: 广州市深研专利事务所44229 代理人: 刘玉颖
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 在线 社交 网络 影响力 传播者 识别 量化 方法
【说明书】:

技术领域

发明属于信息领域,特别涉及一种在线社交网络中有影响力传播者识别与量化的方法。

背景技术

现代的在线社交网络平台正以其强大的传播与交流功能逐步取代传统媒体,成为现代人们日常生活中的重要组成部分。这些社交网络的一个共有的特性就是它们巨大的规模。一些信息爆发式的传播会在整个社交网络上产生影响,这也是一些市场营销手段的理论依据。

顶点传播能力是指一个顶点如果传播一个消息,最终能影响其它顶点数量的期望值。目前,该领域认为度量顶点传播影响力需要获取网络的全局信息并且该领域最流行的度量算法如k-shell等都需要基于全局网络结构来设计。但是,随着网络规模的增大,如现实生活中网络可能有数以亿计的节点,全局网络结构会变得难以获取。这就引出一个问题,通过局部网络结构能否度量全局网络传播影响力。大型在线社交网络的成员数目庞大,它们的出现对传统社会网络中的影响最大化算法,包括传播模型均提出了巨大的挑战。近年来,社会网络中影响最大化算法再次成为研究热点。目前研究的目标主要集中在如何扩大影响范围同时降低算法的时间复杂度。

实证研究表明,社交网络上的信息传播可以用SIR家族传播模型来进行表示。而早在2003年就被证明,SIR模型等价于网络上的边渗流模型。为清楚起见,下面介绍网络上的边渗流中最为简单的模型。

一般将社交网络抽象为一张有向(无向)图G(V,E),V代表节点的集合,每个点表示个人或组织;E代表边的集合,每条边表示个体之间的关系(合作、朋友、敌对等)。每个节点有两种状态,激活状态(购买了某产品或接受了某观念等)和未激活状态(还未购买或未接受)。处于激活状态的节点对处于未激活状态的节点存在影响,如果这个影响导致了某个节点从未激活状态变为激活状态则这个过程称为激活。某节点的邻居节点被激活的越多,则该节点被激活的可能性就越大。新激活的节点又会影响其处于未激活状态的邻居节点。随着时间的推移,越来越多的节点从未激活状态转变为激活状态。整个传播过程是不可逆的,即:一个节点可以从未激活状态变为激活状态,反之则不可。

对于给定的网络,假设每条边以概率p保留,或者说以1-p的概率去掉。显然,p=0意味着删除所有边,而p=1就是原始的网络。当p<1时,原始网络可能会分解成若干个联通子图(如图1所示)。渗流理论主要集中在研究这些联通子图大小的分布、最大联通子图的大小等与p以及网络结构的关系。渗流理论中最迷人的是相变理论:当p很小时,所有的联通子图都会比较小,且远小于整个网络的规模;当p大于某一个临界值pc时,会出现一个而且只有一个(不考虑链状等人为构造的特殊网络)最大的联通子图,这个特殊联通子图的规模与整个网络的规模成正比。也就是,当网络规模趋于无穷大时,该联通子图的规模与网络规模的比值趋于一个大于0的常数,而其它子图(包括规模第二大的)的规模与整个网络规模的比值将趋于0。这时我们把这个最大的联通子图叫做巨联通子图(Giant Component),pc叫做相变点。

一个顶点的影响力或者说传播能力天然定义为:其中,Si表示顶点i的传播能力,Pi(s)是从顶点i出发信息传播范围为s的概率。由于网络结构的复杂性,在理论上我们非常难以计算Pi(s),但是,双峰分布告诉我们一个重要的事实:顶点传播能力的天然定义公式只有最后一项(s为巨联通子图规模)起主导作用。从图2可以看到,一个信息传播开来的时候传播范围比没有传播开始的传播范围要大几个数量级,这暗示:求一个顶点的期望传播范围时,只需考虑传播那一项(巨联通子图项),传播不开的那些都可以忽略不计。从而我们可以得到顶点的传播能力期望最简单的,用一句话就能讲完的物理定义:一个顶点的传播能力,等于该顶点在最大连通子图中的概率乘以最大连通子图大小。其数学描述如下:

Si=sP(i,s)

由于传播的结果只可能是两个相态中的一个,因此只需知道一个相态的信息,就可以得知另一个相态信息。而这两个相态中,第一个是个局域态,也即是说我们只需使用网络局部的信息就可以获得这个态的所有特征。同样,一个顶点群V的传播能力可以定义为p(V,s)为V中的结点一共可以传播的范围为s的概率。

在现有技术中,普通贪心算法(NGA算法)可以达到识别和量化社交网络中有影响力传播者的目的,但是时间复杂度非常高。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711165911.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top