[发明专利]一种基于节点重要度和分离度的Web社区划分方法有效
申请号: | 201711192712.8 | 申请日: | 2017-11-24 |
公开(公告)号: | CN107862073B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 杜航原;白亮 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 山西五维专利事务所(有限公司) 14105 | 代理人: | 郭海燕 |
地址: | 030006 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 节点 重要 分离 web 社区 划分 方法 | ||
1.一种基于节点重要度和分离度的Web社区划分方法,其特征在于,包括以下步骤:
步骤1、将Web网络表示为图G(V,E)的形式,利用图中的节点表示Web页面,利用图中的边表示Web页面间的链接;
步骤2、计算Web网络的图G(V,E)中每个网络节点的重要度,用于描述某一Web页面对其可能隶属的网络社区中其它页面的最大凝聚性,即社区内部的稠密性;
步骤3、计算Web网络的图G(V,E)中每个节点的分离度,用于反映某一Web页面与其可能隶属的网络社区之外的页面间的最大相关性,即社区外部的稀疏性;
步骤4、计算每个节点的代表度,节点代表度用于描述某一节点对其所在社区的代表能力;
步骤5、将网络中的所有节点按照重要度从大到小进行排序,依据节点代表度从中选取K个网络社区的中心节点,其中K为待划分Web网络的社区数量;
步骤6、对于步骤5获得的按照节点重要度排序的网络节点,依据节点重要度和相似度确定每个网络节点的社区标签;
步骤7、将网络中社区标签一致的节点代表的Web页面归为同一网络社区,并进行结果输出,完成Web网络的社区划分;
所述步骤2中的节点重要度定义为节点的度与其邻居节点中最大相似度的乘积,其计算方法为:
首先,计算网络中每个节点的度,即直接与该节点连接的边的数量,节点vi的度记做di;
接着,计算网络中每个节点与其具有直接连边关系的邻接节点的相似度,相似度是指两个节点拥有的共同邻接节点数量,节点vi与其某一邻接节点vj间的相似度记做si,j;
最后,依据节点的度及其邻居节点的相似度,计算每个节点的重要度,对于任一节点vi,其重要度记做Ii,计算方法如式(1)所示:
所述步骤3中节点分离度定义为重要度高于该节点的邻居节点与这个节点间的最大相似度,对于任一节点vi,其分离度记做Di,计算方法如式(2)所示:
其中,vj表示重要度高于节点vi的邻居节点,Ij表示vj的重要度;
所述步骤4中任一节点vi的代表度记做Ri,其计算方法如式(3)所示:
2.根据权利要求1所述一种基于节点重要度和分离度的Web社区划分方法,其特征在于,步骤1中所述Web网络的图表示形式记作G(V,E),利用图中节点V=(v1,v2,…,vi,…,vm)表示网络中的Web页面,m为节点数量,其中第i个节点vi代表Web网络中的第i个页面;利用图中的边E=(e1,e2,…,ej,…,en)表示Web页面间的链接,n为边的数量,其中第j条边ej表示网络中的第j个链接。
3.根据权利要求1所述一种基于节点重要度和分离度的Web社区划分方法,其特征在于,步骤5中选取K个网络社区的中心节点的具体方法如下:
首先,将网络中的所有节点按照重要度从大到小进行排序,排序后的节点记为对于排序后的任意2个节点和满足:若i<j,则其重要度Di>Dj;
然后,从排序后节点中选择代表度最大的K个节点作为网络社区中心,记做C=(c1,c2,…,ca,…,cK),其中ca表示第a个社区的中心节点,1≤a≤K表示社区中心的序号。
4.根据权利要求1所述一种基于节点重要度和分离度的Web社区划分方法,其特征在于,步骤6中对于排序后的网络节点中任一节点其社区标签li的确定方法如下:
首先,由步骤5产生的K个社区中心分别属于K个网络社区,这些社区中心节点拥有K个不同的社区标签;
接着,对于非社区中心节点,其社区标签与重要度大于自身且与自身相似度最高的中心节点一致,可由式(4)描述:
其中,Ii表示步骤5获得的排序后的网络中的节点的重要度,Ia表示步骤5获得的第a个社区的中心节点ca的重要度,si,a表示节点和社区中心ca间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711192712.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于大数据技术分析车辆入城套牌作案的方法
- 下一篇:大数据量参数快速读写方法