[发明专利]一种基于邻居信息和属性网络表征学习的微博用户社团发现方法有效
| 申请号: | 202010742856.1 | 申请日: | 2020-07-29 |
| 公开(公告)号: | CN112084418B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 徐新黎;肖云月;杨旭华;徐齐婧;周艳波 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F18/23213;G06Q50/00 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 邻居 信息 属性 网络 表征 学习 用户 社团 发现 方法 | ||
一种基于邻居信息和属性网络表征学习的微博用户社团发现方法,利用现有的微博数据构建属性网络G=(V,E,F),根据用户关注信息的邻接矩阵A计算节点相似度SAsubgt;ij/subgt;,根据用户属性信息矩阵F计算属性接近度矩阵SF,对网络拓扑和属性信息联合建模,采用分布式算法进行求解,最小化目标函数J,得到每个用户的嵌入向量H,对每个用户的嵌入向量H进行k‑means聚类,得到用户的类别标签,实现社团发现。本发明使用属性网络表征学习框架融合了微博用户的关注信息和属性信息,将高维用户信息转化为低维特征空间的向量,用k‑means聚类算法实现社团发现。降低了社团划分的复杂度,提高了社团发现的准确性,具有良好的性能。
技术领域
本发明涉及网络科学领域,特别是指一种基于邻居信息和属性网络表征学习的微博用户社团发现方法。
背景技术
随着信息技术的极大发展,逐渐出现了以Facebook、微博为代表的大型属性网络,这些社交网络是在人们日常工作和娱乐生活中占重要一部分。而微博是在当今中国社交网络中具有极大的代表性,可以实时看到最新最热的新闻消息,也可以发布自己的动态或者及时看到明星的动态,深受广大年轻人的喜爱。微博中的用户社区是一种大型节点属性网络,社团内部的成员往往连接较紧密并且爱好相同或相似。
在节点属性网络中划分社团有很多的作用,微博平台可以利用不同社团内的用户的联系和爱好为用户定制个性化推荐,可以利用划分的社团判断机器人用户。同样的,平台可以依此精准投放广告,用户可以找到更多自己感兴趣的其他用户或者内容。
近年来已经提出一些属性网络社团发现方法,例如Block-LDA算法、Circles算法、CESNA算法等,这些社团发现的算法对网络拓扑的挖掘不够,而且准确率并不高,不能很好地将相似的用户划分到同一社团。
发明内容
为了克服目前在大型属性社交网络的社区发现方法存在的无法有效融合网络拓扑和属性信息、社团划分准确率不高等方面的缺陷,本发明提出了一种有效的基于邻居信息和属性网络表征学习的微博用户社区发现方法,首先将微博网络的拓扑信息和用户属性信息通过属性表征框架转化成特征空间的嵌入向量,该框架深入挖掘了用户的邻居信息并将拓扑结构和属性信息很好地融合在一起,然后使用k-means聚类划分社团,提高属性网络社团发现的准确率和效率。
本发明解决其技术问题所采用的技术方案是:
一种基于邻居信息和属性网络表征学习的微博用户社区发现方法,包括如下步骤:
步骤一:微博网络表示为一个属性网络G=(V,E,F),其中V={v1,v2,...,vn}为节点集合,每个节点表示一个用户,节点数即用户总数n=|V|,E为边集合,所有微博用户的连边关系构成一个邻接矩阵A,每个用户的属性F’={f1,f2,...,fm},微博用户属性数量m=|F’|,所有微博用户的属性表示为一个n行m列的属性信息矩阵F;
步骤二:根据微博用户的连边关系矩阵A,计算节点相似度SAij
其中,cij为用户i与用户j的共同邻居数,wij为邻接矩阵A中用户i与用户j相连的边权,即在用户i与用户j有关注的情况下,节点相似度SAij为两用户的共同邻居数比上节点总数,在两用户没有关注的情况下,SAij为0;
步骤三:对属性信息矩阵F,采用余弦相似度度量标准计算属性接近度矩阵SF;
步骤四:对网络拓扑和属性信息联合建模,设置嵌入向量H的维度d,采用分布式算法进行求解,最小化目标函数J,得到每个用户的嵌入向量H,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010742856.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





