[发明专利]实现演变点发现的社会网络演化分析方法及系统有效
申请号: | 201010198329.5 | 申请日: | 2010-06-11 |
公开(公告)号: | CN101872359A | 公开(公告)日: | 2010-10-27 |
发明(设计)人: | 杨娟;吴斌;王柏;杨胜琦;柯庆;张雷 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 黄启行;张文 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 演变 发现 社会 网络 演化 分析 方法 系统 | ||
技术领域
本发明涉及实现演变点发现的社会网络演化分析方法及系统。
背景技术
目前数据挖掘任务处理的对象主要是单独的数据实例,这些数据实例往往可以用一个包含多个属性值的向量来表示,同时这些数据实例之间假设是统计上独立的。例如,要训练一个疾病诊断系统,它的任务是诊断一个被试者是否患有某种传染病,通常的做法是用一个向量来表示一个被试者,同时假设各被试者之间的患病情况是相互独立的,即知道一个确诊病人对于诊断其他被试者是否患病不能提供任何帮助。直观经验告诉我们这种假设是不合理的,一个人的亲戚、朋友患有此传染病,则他相对其他人有更大的可能性患病。在社会里,人与人不是简单的统计上独立的采样点,他们之间必然存在着联系和影响,忽视了这种联系会对整个诊断系统的性能带来很大的影响。为了解决这个问题,必须将数据实例之间的关系同时考虑进来,从而提出了社会网络的概念,可以用图结构来刻画社会结构。
社会网络包括很多节点和连接这些节点的一种或多种特定的链接。其中,节点往往表示了个人、团体、人、文章和/或服务器等物理存在的实体;链接则表示节点之间存在的各种关系,如朋友关系、亲属关系、贸易关系、引用关系等。社会网络除了图结构表示之外,还有其他社会学形式和代数形式的表示方式。
在很多情况下,链接随着时间不断改变,那么对社会网络的分析需要对一段时间内的社会网络变化情况进行分析,目前,主要是将分析的时间段等分后进行分段分析即增量分析。然而,在实际情况中,事物的发生发展不是均匀的,增量分析方法无法准确分析出社会网络中的噪声和事件,其中,噪声是指与社会网络分析主题无关的联系,主要由具有社会化特征的个体行为的随机性和不确定性造成的,例如拨错电话号码而造成的无效通话;事件是指与社会网络分析主题相关的异常联系,例如人们在春节期间的通话。增量分析方法,一方面,可能会在分析过程中放大噪声,或者往往无法捕捉该时间段中对事物发展产生重大变化的演变点(即事件),从而无法提供准确的分析结果。
发明内容
因此,本发明的目的在于提供实现演变点发现的社会网络演化分析方法及系统,从而可以提供准确的分析结果。
为实现本发明的上述目的,提供一种实现演变点发现的社会网络演化分析方法,包括:
按照时间顺序计算相邻两个社会网络之间的相似度;
根据计算结果求出相似度的突变点,即演变点;
将相邻突变点之间的社会网络快照选择叠加,形成相应时间段的社会网络拓扑图,其中,所述相应时间段的社会网络拓扑图与相邻突变点的平均距离最小,社会网络快照为根据最小粒度划分的一系列社会网络;
根据所述社会网络拓扑图进行聚类和关联分析。
优选地,其中,所述计算相邻两个社会网络之间的相似度包括:
计算相邻两个社会网络之间的距离,所述两个社会网络之间的距离与所述两个社会网络之间的相似度成反比。
优选地,其中,所述计算相邻两个社会网络之间的距离还包括:
在计算过程中忽略噪声节点,所述噪声节点为只在单一时刻出现过的节点
优选地,其中,所述计算相邻两个社会网络之间的相似度包括:
采用滑动窗口对社会网络中的节点进行分类,分别得到离网节点、入网节点和稳定节点,其中,所述离网节点为变化点后不再出现的节点,所述入网节点为变化点后新入网的节点,所述稳定节点为变化点前后均出现的节点;
根据离网节点相似度的变化情况,计算变化点两侧离网节点的变化值;
根据入网节点相似度的变化情况,计算变化点两侧入网节点的变化值;
根据稳定节点相似度的变化情况,计算变化点两侧稳定节点的变化值;
累计离网节点的变化值、入网节点的变化值和稳定节点的变化值,得到变化点及对应的变化值。
优选地,所述根据计算结果求出相似度的突变点包括:
根据所有变化点及对应的变化值形成时间轴;
根据所述时间轴求出相似度的突变点,即得到演变点。
优选地,其中,所述将相邻突变点之间的社会网络快照选择叠加包括:
对所述时间轴归一化处理,产生用于线性分段的基准;
采用所述滑动窗口找出相对于所述基准的较高值和较低值;
裁剪所述较高值以及平滑所述较低值得到平稳时间段的社会网络。
本发明还提供一种实现演变点发现的社会网络演化分析系统,其特征在于,该系统包括:
计算单元,用于按照时间顺序,计算相邻两个社会网络之间的相似度;
突变单元,用于根据计算结果,求出相似度的突变点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010198329.5/2.html,转载请声明来源钻瓜专利网。