[发明专利]基于主题交互的社区发现方法有效

专利信息
申请号: 201510390683.0 申请日: 2015-07-06
公开(公告)号: CN105159911B 公开(公告)日: 2018-07-10
发明(设计)人: 王柱;於志文;冯斌;郭斌 申请(专利权)人: 西北工业大学
主分类号: G06F17/30 分类号: G06F17/30;G06Q50/00;G06K9/62
代理公司: 西北工业大学专利中心 61204 代理人: 王鲜凯
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 贡献度 社区发现 超图模型 迭代计算 权值计算 种子节点 社区 聚合 层次聚类 主题节点 主题信息 准确度 时间段 构建 网络 中文
【权利要求书】:

1.一种基于主题交互的社区发现方法,其特征在于包括以下步骤:

步骤一、采用LDA提取微博网络中文本的主题信息,根据微博网络中用户的每一次交互信息建立超图模型;超图模型中包括用户节点以及主题节点;每一次发布行为构成一条发布边u-t,其中u表示用户,t表示主题,每一次转发行为构成一条转发边u1-t1-u2,暨用户u1从用户u2处转发了主题为t1的微博文本;

步骤二、计算用户集合U中不同用户有关不同主题的用户熵,同时计算主题集合T中不同主题有关不同用户的主题熵;采用计算发布边的权重,其中Cut表示u-t边出现的次数,evu表示用户熵,evt表示主题熵;采用表示发布边的权值大小;

步骤三、在将网络映射为超图模型后,用表示子图V'的密度,其中s表示子图中的所有边,ws表示边的权值,si表示边s的第i个相关节点;表示si节点对整个子图的贡献程度;若子图V'是密集子图,则f(x)达到最大值;在超图中进行社区发现的问题采用以下公式表达:

其中w(v1,…vk)表示包含节点v1,…vk的边的权值,所有节点对社区的最大贡献为1/ε,暨ε用来控制社区的初始大小;

计算网络中的每一个用户节点的邻居节点的数目|Nu|,其中Nu表示用户u的邻居节点集合,表示用户u的邻居节点ui的邻居节点数,表示用户u的所有邻居节点的平均邻居节点数;选取|Nu|>avg(Nu)的用户节点作为种子节点;

从种子节点出发,选取与种子节点相关的节点构成初始子图;在初始子图中,根据节点所在超边的权重计算节点的权重比例p(i)=(∑w(1,…k-1,i))/(∑w(1,…,k)),其中i表示节点,w(1,…,k)表示初始子图中的超边的权值,w(1,…k-1,i)表示初始子图中包含节点i的超边的权值;设暨对avg(Nu)向上取整;根据节点的权重比例,以及xi<ε计算不同节点对密集子图的初始贡献度xi

步骤四、采用拉格朗日公式进行问题求解;同时,对节点进行分类Vu(x)={i|xi∈(0,ε]},Vd(x)={i|xi∈[0,ε)},表示f(x)关于xi的偏导数;对公式进行推导,根据组合优化的KKT条件,根据公式迭代的计算节点xm对密集子图的贡献程度,其中i表示Vu中gi(x)最大的节点,j表示Vd中gi(x)最小的节点,l表示迭代次数;

其中gij(x)表示x的两阶导;迭代终止条件为:节点贡献度不在变化或社区大小小于ε;得到社区的密集子图;

步骤五、对于得到的密集子图,采用Jaccard系数作为相似度进行度量,以层次聚类的方式得到不同程度下的社区。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510390683.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top