[发明专利]基于资源整合与信息传播特征的社区发现及演化方法有效
| 申请号: | 201310062057.X | 申请日: | 2013-02-27 |
| 公开(公告)号: | CN103106616A | 公开(公告)日: | 2013-05-15 |
| 发明(设计)人: | 高珩;李秋丹;曾大军;王飞跃;包红云;宋双永 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 资源整合 信息 传播 特征 社区 发现 演化 方法 | ||
技术领域
本发明涉及社区网络用户行为的数据挖掘领域,具体涉及一种基于资源整合与信息传播特征的社区发现及演化方法。
背景技术
目前,社会化信息传播网络已成为很多人生活中不可或缺的一部分。社会化信息传播网络平台的迅速发展以及该平台上资源的爆炸式增长,催生了大量的应用研究,并带来了广泛的社会影响。为确保网络用户能够高效准确的获取微博资源,业界需要对社会化信息传播网络平台提供有效的技术支持。
发现社会化信息传播网络中的社区结构与演变模式无疑是深入研究社会化信息传播网络至关重要的一步,它不仅帮助我们了解用户在社会化信息传播网络中的实际参与情况,而且能够帮助我们更好地探究社会化信息传播网络的结构,并对其进行有效地利用和开发。社区发现与社区结构演变技术同时也广泛应用在生物学、物理学、计算机图形学和社会学等领域。其不仅在理论研究方面具有很高的学术价值,在实际生活中也有着十分重要的实用价值。
目前,业界对于用户社区结构挖掘工作的研究,主要围绕两方面展开:基于链接的方法与基于内容的方法。基于链接的方法主要利用用户的交互所产生的网络结构进行社区结构探索:White等人将模块化函数Q与谱聚类算法相结合,介绍几种社区检测算法;Flake等人提出了一种基于最大流最小割框架的社区检测算法;Psorakis等人在文献中提出了非负矩阵分解方法解决图的软聚类问题。基于内容的方法围绕用户在网络中的内容信息,开展社区结构挖掘研究:Zhang等人采用LDA(Latent Dirichlet Allocation)模型用于用户社区结构检测;Steyvers等人提出了AT(Author-Topic)模型,以挖掘用户、文档、主题及词四者之间的关系。作者将主题看做主题词的多项式分布,而用户空间则用主题的概率分布建模;McCallum等人在此基础上进一步提出了ART(author-recipient-topic)模型来挖掘具有相似行为的用户组。在用户社区结构挖掘相关研究中,传统工作通常有两类不足,一是忽视了用户的内容信息与链接关系之间的关联,即使是对同时考虑链接信息和用户内容的多关系方法,通常做法也是将这两部分分开来独立进行;二是较少考虑用户链接的方向信息,目前对有向网络的研究还主要集中在基于链接的方法。
近年来也有不少研究者结合用户链接与内容关系在社区发现研究方面做了有益探索。Pathak等人提出了一种社区-作者-接受者-主题的社区挖掘模型(CART模型)。该模型是一种贝叶斯产生式模型,充分利用了用户连接与内容关系,实验表明它能从Eron邮件数据集中挖掘出有意义的社区。然而,CART模型却并不适用于拥有快速信息传播特征的社交网络。Sachan等人提出了多种产生式模型,以便基于人们热议的话题与交互关系发现社区结构,作者指出这些模型可以较好地适应社交网络快速信息传播的特性。但是采用产生式模型,在内容分析时会纳入许多无关的关键词,用户往往会对他们所在社区的主题产生困惑。
动态网络中的社区演变模式分析也是当前社区研究的一个重要课题。Toyoda等人通过网络社区制图研究了在线社区的演变,并介绍了一些评价指标来衡量演化程度。Kumar等人研究了博客社区的出现过程,并分析了社区的演化及其相应特征(出度、入度等)的变化过程。Asur等人提出了一种基于事件的方法来捕获个人及社区行为的演化规律。Yang等人将社区检测及其演化分析集成到统一的产生式概率模型框架下,采用贝叶斯方法评估未知参数的后验分布,从而提供了社区成员估计的鲁棒性。Lin等人提出了FacetNet方法将抽取社区并检测其演变过程放在统一的框架内。
上述研究工作主要应用于无向网络,取得了较好性能,然而某些用户交互网络为有向网络,如微博中的用户交互网络,而且互动性较强。针对这类网络中的社区演变模式分析,先前的工作简单的忽略边的方向,并且不同时间片之间的社区结构比较独立,这种处理策略导致网络结构的许多信息没有被充分利用,用户之间信息交流传播的影响在其中难以体现,而这些网络特性有利于对社区演变过程进行更准确的分析。
因此,本发明基于“资源整合与信息传播”的思想,提出了一个统一的协同矩阵分解算法框架解决该问题,用于社交网络的社区发现与社区演变模式挖掘。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310062057.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:汽车盘式制动刹车片钢背的精冲模具
- 下一篇:一种网络购物系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





