[发明专利]一种基于信息理论的微博传播可视化分析方法与系统有效
申请号: | 201310151186.6 | 申请日: | 2013-04-26 |
公开(公告)号: | CN103279887A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 王长波;叶鹏;刘玉华;肖昭 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 上海蓝迪专利事务所 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 理论 传播 可视化 分析 方法 系统 | ||
1.一种基于信息理论的微博传播可视化分析方法,其特征在于该方法具体包括:
a)基于微博数据的信息传播影响因子分析
ⅰ)微博信息量计算
基于信息理论即香农熵理论计算微博信息量,具体地,对于在ti+1时刻出现的某一微博其信息量由数据集确定,即ti+1时刻之前的数据来确定,包括以下几个步骤:
1)对数据集中的每条微博进行关键词切分,然后统计出所有这些关键词在数据集中的词频,建立关键词词频字典;
2)对于目标微博
这里wi是微博关键词keywordi的权重值,fi是关键词keywordi在基数据集中出现的频次,total是基数据集中所有关键词的频次;
3)计算目标微博的信息量MIQ,由下面公式得出:
采用来确定目标微博的信息量,这里(k-i)/i=0.04;
ⅱ)用户偏好计算
通过分析用户对微博的情感偏好和用户关系偏好在微博传播中的作用,函数化模拟用户偏好在微博传播中的影响,情感偏好的计算具体包括:
1)对于目标微博
2)求得该微博的情感值MEV定义为:
3)则该微博的情感ME可以被表示出来,如公式5所示:
4)最后定义用户的情感偏好ET如下:
这里CountME是目标微博ME在基数据集中的数量,N是基数据集中基数据集中的微博总数,α是随机参数;
用户关系偏好的计算具体包括:
1)首先定义用户影响因子如公式(7),
其中,Nfollowers是该用户粉丝的数量,Ntotal是研究的数据集合中所有的用户数;
2)用户关系偏好函数IF定义如下:
IF=eUI+β (8)
其中β是随机参数;
b)微博传播量化模型
结合微博信息量与用户偏好以及信息衰减因子建立微博传播量化模型,定量地跟踪微博的传播过程,具体地,根据上面的分析,给出微博传播量化模型:
IDF(t)=τ(t)·MIQ·UF (9)
UF=ET·IF (10)
其中,IDF(t)是传播到t时刻该微博的影响值,τ(t)=e-at是信息衰减因子,UF是用户偏好。
2.一种基于信息理论的微博传播可视化系统,其特征在于该系统具体包括:
a)层次布局可视化,动态展示微博传播过程
结合同心圆环以及树状放射形的可视化技术,将微博基于时间序列的传播形式转化成同心圆环的层次形式,点分布在圆环中,每个点代表一个用户,点颜色的深浅代表IDF值的大小;点与点的连线代表转发与被转发关系,具有向外放射的方向;线条基于微博传播的时间特性动态的向外连接,展示微博传播的过程;
b)基于信息量定量分析的微博炒作行为的发现
对于某一话题中的微博,计算它们的IDF值,并跟踪微博的传播情况,如果它们的IDF值较小,而微博传播中却有大量用户参与,就标记为疑似炒作微博;
c)微博传播过程中的异常用户行为的发现
对微博传播中的用户进行跟踪,如果传播到该用户时的IDF值较小,而该用户的转发数却较多,则该用户被标记为异常用户;如果该微博的标记为疑似炒作微博且在传播中包含的异常用户数量大于一阈值,则该微博被标记为炒作微博。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310151186.6/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置