[发明专利]一种基于标签传播算法的社团发现方法及系统有效
申请号: | 201410657458.4 | 申请日: | 2014-11-18 |
公开(公告)号: | CN105677648B | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 吴海贵 | 申请(专利权)人: | 四三九九网络股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 席小东 |
地址: | 361008 福建省厦门市厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 传播 算法 社团 发现 方法 系统 | ||
1.一种基于标签传播算法的社团发现方法,其特征在于,包括以下步骤:
S1,获得源数据:即,对于被分析的网络论坛,通过读取数据库,获得所述网络论坛中某一历史时刻T1至当前时刻T2之间的所有单向互动记录,其中,所述单向互动记录包括发起方的用户ID以及接收方的用户ID;
S2,将所述网络论坛中某一历史时刻T1至当前时刻T2之间的参与单向互动的所有用户ID分别映射为关系拓扑网络图的节点;将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,其中,向量的方向为:由代表单向互动发起方的节点指向代表单向互动接收方的节点;将在某一历史时刻T1至当前时刻T2之间通过向量连接的两个节点之间的单向互动次数作为连接所述两个节点的向量的权重值,由此得到初始的关系网络图;
S3,初始化所述初始的关系网络图,即:为所述初始的关系网络图中的每个节点均赋予唯一的标签;
S4,令迭代计数器t=1;
S5,以随机顺序排列S3得到的关系网络图中的各个节点,按所排列的顺序遍历更新所述关系网络图中的所有节点的标签;其中,对于任意一个节点m,对所述节点m进行更新的方法为:
首先获取节点m的所有邻接节点;其中,所述邻接节点指:与节点m发生互动,并且,相对于节点m,作为单向互动接收方的所有节点;然后,判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果是,则将所有邻接节点中出现次数最多的标签更新为节点m的新标签;如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,然后,从所述邻接节点集M中选取与所述节点m连接的向量的权重值最大的邻接节点作为选定节点,将所述选定节点的标签更新为节点m的新标签;
S6,判断是否满足预设置的迭代终止条件,其中,所述迭代终止条件指:所述关系网络图中的任意节点m’的标签满足以下条件:如果节点m’的所有邻接节点中出现次数最多的标签为一个,则节点m’的标签等于其所有邻接节点中出现次数最多的标签;如果节点m’的所有邻接节点中出现次数最多的标签为两个以上,将出现次数最多的标签所对应的邻接节点组成邻接节点集M’,则节点m’的标签等于邻接节点集M’中与节点m’连接的向量的权重值最大的邻接节点的标签;
如果未满足,则令t=t+1,反复迭代执行S5,直至满足预设置的终止条件;如果满足,则对所述网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。
2.根据权利要求1所述的基于标签传播算法的社团发现方法,其特征在于,S3中,为每个节点所赋予的唯一的标签即为用户ID。
3.根据权利要求1所述的基于标签传播算法的社团发现方法,其特征在于,S5中,通过以下方法获取节点m的所有邻接节点:
建立邻接节点映射表;所述邻接节点映射表存储所述关系网络图中每一个用户ID与其所有邻接节点对应的用户ID的对应关系;
通过查找所述邻接节点映射表,获得节点m的所有邻接节点。
4.根据权利要求1所述的基于标签传播算法的社团发现方法,其特征在于,S6之后,还包括:
通过簇结构的方式显示所述关系网络图的所有节点,其中,具有相同标签的节点属于同一个簇。
5.一种基于标签传播算法的社团发现系统,其特征在于,包括:
源数据获取模块,对于被分析的网络论坛,获得所述网络论坛中的源数据;其中,所述源数据指所述网络论坛中某一历史时刻T1至当前时刻T2之间的所有单向互动记录,其中,所述单向互动记录包括发起方的用户ID以及接收方的用户ID;
关系网络图创建模块,用于读取所述源数据获取模块,将所述网络论坛中某一历史时刻T1至当前时刻T2之间的参与单向互动的所有用户ID分别映射为关系拓扑网络图的节点,将单向互动关系映射为关系拓扑网络图中节点之间相互连接的向量,将在某一历史时刻T1至当前时刻T2之间相互连接的两个节点之间的单向互动次数作为连接所述两个节点的向量的权重值,由此得到初始的关系网络图;
关系网络图初始化模块,用于初始化所述关系网络图创建模块所创建的初始的关系网络图,即:为所述初始的关系网络图中的每个节点均赋予唯一的标签;
迭代终止条件设置模块,用于设置迭代终止条件,所述迭代终止条件指:所述关系网络图中的任意节点m’的标签满足以下条件:如果节点m’的所有邻接节点中出现次数最多的标签为一个,则节点m’的标签等于其所有邻接节点中出现次数最多的标签;如果节点m’的所有邻接节点中出现次数最多的标签为两个以上,将出现次数最多的标签所对应的邻接节点组成邻接节点集M’,则节点m’的标签等于邻接节点集M’中与节点m’连接的向量的权重值最大的邻接节点的标签;其中,节点m’的邻接节点指:与节点m’发生互动,并且,相对于节点m’,作为单向互动接收方的所有节点;
迭代处理模块,用于在每次迭代中,以随机顺序排列关系网络图中的各个节点,按所排列的顺序遍历更新所述关系网络图中的所有节点的标签;其中,对于任意一个节点m,对所述节点m进行更新的方法为:首先获取节点m的所有邻接节点;然后,判断节点m的所有邻接节点中出现次数最多的标签是否为一个,如果是,则将所有邻接节点中出现次数最多的标签更新为节点m的新标签;如果不是,则将出现次数最多的标签所对应的邻接节点组成邻接节点集M,然后,从所述邻接节点集M中选取与所述节点m连接的向量的权重值最大的邻接节点作为选定节点,将所述选定节点的标签更新为节点m的新标签;
迭代终止判断模块,用于当所述迭代处理模块运行完一次迭代后,判断是否满足所述迭代终止条件设置模块所设置的迭代终止条件,如果未满足,则循环执行所述迭代处理模块,反复进行迭代处理;如果满足,则对所述网络论坛的社团划分过程结束,具有相同标签的节点所对应的用户ID属于同一个社团。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四三九九网络股份有限公司,未经四三九九网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410657458.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种采用旋流分离的雨水截污井
- 下一篇:一种卫生间排水盖板条