[发明专利]一种基于边聚集系数的社会网络群体划分方法在审
申请号: | 201410342707.0 | 申请日: | 2014-07-15 |
公开(公告)号: | CN105279187A | 公开(公告)日: | 2016-01-27 |
发明(设计)人: | 张贤坤;田雪 | 申请(专利权)人: | 天津科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300222 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 聚集 系数 社会 网络 群体 划分 方法 | ||
1.一种基于边聚集系数的社会网络群体划分方法,其特征在于,所述方法包括以下步骤:
步骤A:读取社交网络数据,构造以社交网络用户为节点,用户关系为边的社交网络图;
步骤B:节点标记:为每一个用户节点随机分配一个唯一的标签值,作为它所属社区的标识;
步骤C:初步社区划分:对图中的所有顶点的标签进行迭代更新,每次迭代后,节点的标签值更新为其邻接节点的标签中数量最多的标签值;
步骤D:社区划分细化:如果有多个标签值的数量同为最大值时,计算待更新节点与邻接节点之间边的边聚集系数,边聚集系数大的邻居节点标签优先被选择进行传播;经过若干次迭代后,每个用户节点邻居中的标签变化趋于稳定;
步骤E:将所有具有相同标签的节点归为一个社区。
2.根据权利要求1所述的一种基于边聚集系数的社会网络群体划分方法,其特征在于,
在上述步骤B中,为每一个用户节点随机分配一个唯一的标签值,即Cn=Ln,Cn表示节点n所属社区,Ln表示节点n的标签值。
3.根据权利要求1所述的一种基于边聚集系数的社会网络群体划分方法,其特征在于,
在上述步骤C中,对节点的标签值更新为其邻接节点的标签中数量最多的标签值具体过程为:把社交网络图抽象成一个简单的无向图G(N,E),其中,N表示节点的集合,E表示边的集合;Wnm表示连接n,m节点的边的权重,n,m∈N,用Cn表示表示节点n所属社区,Nl(n)表示节点n∈N的邻居节点中标签值为1的节点集合,公式如下:
。
4.根据权利要求1所述的一种基于边聚集系数的社会网络群体划分方法,其特征在于:
在上述步骤D中,所谓边聚集系数,表示连接边的两个节点的聚集程度,它的值越大,代表这条边所连接的两个节点的连接强度就越强,说明这两个节点在同一个社区的可能性就越大,具体定义规则如下:
假设有一条边Eij,它的顶点为i和j,如果想知道网络中是否存在以及有多少另外的节点k与i、j均相邻,即存在另外两条边Ejk、Eik、Eij形成三角环(边数为3的闭合路径);若一个三角环包含一条连接不同社区的边,则该三角环中的另两条边中的某一条仍然连接两个社区的可能性将会很大;因此,一条边的边聚集系数定义为包含该边的三角环所占比例:
其中,ki、kj分别代表节点i和j的度,zij表示网络中实际包含该边的三角形的个数,公式中的分母表示包含该边的最大可能的三角形个数。
5.根据权利要求1所述的一种基于边聚集系数的社会网络群体划分方法,其特征在于:
所述步骤D中,迭代终止条件为社交网络达到平衡,标签数目不再发生变化即终止迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津科技大学,未经天津科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410342707.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多端联机互动系统及其查验修改的方法
- 下一篇:一种图像处理方法和系统