[发明专利]社交网络信息爆发检测方法与系统在审
申请号: | 201510379930.7 | 申请日: | 2015-07-01 |
公开(公告)号: | CN105095988A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 笱程成;包秀国;程学旗;程工;贺敏;刘春阳;杜攀;刘悦;马宏远;张旭;毕涛;刘玮 | 申请(专利权)人: | 中国科学院计算技术研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 信息 爆发 检测 方法 系统 | ||
技术领域
本发明涉及网络信息传播检测技术领域,尤其涉及一种社交网络信息爆发检测方法与系统。
背景技术
以微博为代表的在线社交网络的流行极大的改变了人类获取信息的传统方式,替代了传统大众传媒的部分功能。如各大门户网站和信息分享网站都开设了微博账号,会及时发布相关的新闻消息,各级政府组织、公司和机构也都建立起了微博主页,实时的更新自身的公告和重大事件。更进一步,任何人都能成为消息的产生者,任何消息都可以在社交网上发布并进行传播。
在微博网络中,洪泛式的信息传播使得消息的扩散变得十分的便捷和高效,人们获取信息的时效性大大提高。然而,消息的爆发往往伴随着巨大的社会舆论和影响,对公司来讲,能够在消息爆发的早期就预测到消息爆发的行为,对于自身的在线信誉监控(OnlineReputationMonitoring)具有重要的意义,如果是负面的消息,则及时采取相应的措施,降低公司信誉损失,正面的消息则可借机营销,提升公司业绩。对于政府部门来讲,尽早地发现社交网络中的关于自然灾害事件和公共卫生疾病的消息,对于政府及时采取对应的措施,提前进行相应决策和部署是非常有利的。
目前,预测消息的爆发和流行主要是基于内容特征的突发性分析方法,该方法旨在通过捕捉消息相关的内容特征发生的异常变化,找到相关的突发消息,而内容特征的变化从概率上讲是通过观测值和期望值之间的背离来衡量的。但是,基于内容特征的方法需要检测到内容特征的突发改变,即观测值和期望值之间的背离,也就是说社交网络中对某一消息产生了一定数量的转发和评论,并且已经达到了显著的水平。这在客观上造成了爆发被检测出的时间较大地滞后于爆发实际发生的时间。因此,如何在更早的时刻,即消息在网络中刚刚出现零星的传播,还没有形成一定的规模时预测消息是否会爆发传播是一个需要解决的问题。
综上可知,现有技术在实际使用上显然存在不便与缺陷,所以有必要加以改进。
发明内容
针对上述的缺陷,本发明的目的在于提供一种社交网络信息爆发检测方法与系统,其可以有效的预测社交网络消息是否会爆发传播。
为了实现上述目的,本发明提供一种社交网络信息爆发检测方法,所述方法包括:
A、采集社交网络的结构和用户产生内容;
B、构建用户的话题传播概率矩阵;
C、获取社交网络中用户发布或转发的消息;
D、根据消息的转发标志和时间信息构建消息的传播轨迹;
E、根据所述话题传播概率矩阵构建消息传播矩阵;
F、根据所述消息的传播轨迹和消息传播矩阵,分析消息爆发的可能性。
根据本发明的社交网络信息爆发检测方法,所述步骤A和B之间还包括:
G、对步骤A采集的数据进行垃圾过滤处理。
根据本发明的社交网络信息爆发检测方法,所述步骤G具体为:
对数据文本进行分词、词形还原及去停用词处理。
根据本发明的社交网络信息爆发检测方法,所述步骤B具体为:
根据每条消息的话题分布、用户转发历史记录和用户关注网络,构建用户的话题传播概率矩阵。
根据本发明的社交网络信息爆发检测方法,所述步骤具体为:
根据所述传播概率矩阵计算消息经过多步传播直至收敛后,消息从网络中任一出发点到达社交网络中任一终止点的概率。
根据本发明的社交网络信息爆发检测方法,所述步骤F包括:
F1、根据消息的传播轨迹,分析预测消息的传播范围;
F2、根据所述消息的传播范围,分析消息的爆发可能性。
根据本发明的社交网络信息爆发检测方法,所述步骤F2具体为:
根据消息最终到达的范围,结合该范围占全网的比率和预设的阈值进行比较,判断消息是否爆发。
本发明还相应提供一种社交网络信息爆发检测系统,包括:
数据采集模块,用于采集社交网络的结构和用户产生内容;
传播计算模块,用于构建用户的话题传播概率矩阵;
消息获取模块,用于获取社交网络中用户发布或转发的消息;
轨迹获取模块,用于根据消息的转发标志和时间信息构建消息的传播轨迹;
矩阵生成模块,用于根据所述话题传播概率矩阵构建消息传播矩阵;
分析处理模块,用于根据所述消息的传播轨迹和消息传播矩阵,分析消息爆发的可能性。
根据本发明的社交网络信息爆发检测系统,所述分析处理模块包括:
分析子模块,用于根据消息的传播轨迹,分析预测消息的传播范围;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所;国家计算机网络与信息安全管理中心,未经中国科学院计算技术研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510379930.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置