[发明专利]一种基于谱方法的动态社团划分方法有效
| 申请号: | 202010214082.5 | 申请日: | 2020-03-24 |
| 公开(公告)号: | CN111444454B | 公开(公告)日: | 2023-05-05 |
| 发明(设计)人: | 张泽 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G06F16/958 | 分类号: | G06F16/958;G06Q50/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 方法 动态 社团 划分 | ||
1.一种基于谱方法的动态社团划分方法,其特征在于,包括以下步骤:
步骤1:获取社交网络的网络拓补图G=(V,E,A),表示社交网络中用户的社交关系,并采用人工标注的方式对预设定K个社团标注种子用户;
所述的网络拓补图G=(V,E,A)中V代表用户节点集合,|V|=n表示图上共有n个节点,即用户数量;E代表边集合;A代表用户-用户邻接矩阵;Aij=1表示用户i与用户j互为好友且用户i与用户j的步长为1,Aij=0表示用户i与用户j非好友关系切用户i与用户j的步长为0;
所述的采用人工标注的方式对预设定K个社团标注种子用户具体为:每个社团中应至少设定一个种子用户,作为初始社团中心,并且在用户-用户邻接矩阵A中加入自环,计算公式为:A=A+I,其中I是与A同大小的单位矩阵;所述的社团中心表示为:
其中,Ck表示第k个社团的特征向量,即此社团的均值;表示第k个社团成员第i个特征值的均值;w表示第k个社团成员数量;i代表此社团的第i个用户,i=1,2,3,…,w;
步骤2:获取社交网络中用户的兴趣标签,构成用户特征u={u1,u2,…,ui…,uM};将所有的用户兴趣特征构成用户-兴趣评分矩阵X,并对用户兴趣矩阵进行预处理;
所述的用户特征中u代表一个用户的兴趣特征向量,ui代表用户u对第i个兴趣特征的评分;M为一个用户兴趣特征的个数;所述的用户-兴趣评分矩阵X中Xij代表第i个用户对第j个兴趣的评分值,i=1,2,3,…,M;
步骤3:采用谱方法对社交网络中的用户节点进行H阶信息聚合,节点可以融合步长不超过H的节点信息,得到融合邻居信息的用户-兴趣矩阵,即用户特征矩阵;
信息聚合方程为:
f(X,A)=σ(aggregate(A,X))
此公式表示一次信息传播过程,经过一次信息聚合,节点聚合邻居节点的属性特征,经过非线性激活函数σ(·)变换后,结果为新的用户特征矩阵;经过H次聚合后,用户融合步长不超过H的邻居节点的信息,H的值不超过6;aggregate(·)为聚合函数,表示如下:
aggregate(A,X)=D-0.5AD-0.5X
其中,D是自环邻接矩阵A的度矩阵,其为一个对角矩阵,对角线上元素为Di,i表示度矩阵对角线上元素,表示A上第i行的元素和,N为A的行数,i=1,2,3,…,N,j=1,2,3,…,N,X为用户特征矩阵;D-0.5表示度矩阵D的每个元素的-0.5次幂;
步骤4:对用户特征矩阵使用三支决策动态阈值K-means聚类算法进行社团划分;用户与社团心中的距离采用的是余弦距离,用户与社团中心余弦距离表示为:
在三支动态阈值K-means聚类过程中引入一个决策阈值α,即社团中心的领域范围,利用K-means聚类算法对用户集进行聚类,并在算法执行的过程中采用余弦距离作为相似性评价指标,引入决策阈值α可以有效的将离群用户对象单独成团,并将其作为新的社团中心参与社团划分,具体步骤如下:
步骤4.1:计算剩余用户数据对象到各社团中心Ck的余弦距离d(ui,Ck),并把他们归类到最近的簇Cj={ui|d(ui,Ck)≤d(ui,Cl),j!=l,0l,j≤k};
步骤4.2:由函数得出决策阈值α;
步骤4.3:遍历用户集U中所有对象当将ui归类到最近的簇中;当时,令Ck+1={ui},更新社团中心点集C,即将ui当都作为一个新的社团中心并加入到已标记用户集UC中,社团数量更新为k`;
步骤4.4:重新计算每个社团中心中用户对象的均值,作为社团中心的新中心点;
步骤4.5:继续执行步骤4.1~4.4,依据目标函数设置终止条件和设置最大迭代次数,避免陷入无限循环,输出二支划分结果集C`={C1,C2,…,Ck`};
步骤4.6:取所有类样本数量均值的作为领域大小,由函数得出q的预测值;
步骤4.7:遍历二支聚类结果集C`={C1,C2,…,Ck`}中所有类C`j,取考虑ui的q邻域Neigq(ui),即距离该用户最近的q个数据点组成的集合;若则
步骤4.8:对每一类C`j,取ui∈C`j,考虑ui的q邻域Neigq(ui);若则否则
步骤4.9:通过步骤4.7和步骤4.8得到和返回令
步骤4.10:令执行步骤4.1~步骤4.5,得到对边界外区域用户的二次聚类结果集CB={C`1,C`2,…,C`k`};
步骤4.11:输出最终社团划分结果集C={CP,CB},最终结果集由CP和CB构成,结果集CP中包含了所有经过确定划分的核心区域用户对象,结果集CB包含了被划分至不确定性边界之外的用户,经过二次确定性划分处理的用户,由此得出最终社团划分结果集C。
2.根据权利要求1所述的一种基于谱方法的动态社团划分方法,其特征在于:所述的步骤2中需对用户-兴趣评分矩阵进行预处理,对缺失过多兴趣评分项的用户进行舍弃并将此用户从网络拓补图中舍弃,对其他缺失数据进行邻居用户的同兴趣评分均值补全,并且对用户-兴趣评分矩阵进行归一化,矩阵中每一行代表一个用户的兴趣特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010214082.5/1.html,转载请声明来源钻瓜专利网。





