[发明专利]一种基于时间序列的网络舆情预测方法无效
| 申请号: | 200810226293.X | 申请日: | 2008-11-12 |
| 公开(公告)号: | CN101394311A | 公开(公告)日: | 2009-03-25 |
| 发明(设计)人: | 刘云;程辉;沈波;李勇;张振江;丁飞;司夏萌;张立;张彦超 | 申请(专利权)人: | 北京交通大学 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24 |
| 代理公司: | 北京市商泰律师事务所 | 代理人: | 毛燕生 |
| 地址: | 100044*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 时间 序列 网络 舆情 预测 方法 | ||
技术领域
本发明涉及网络信息安全分析和预测技术,更具体地,涉及一种网络舆情预测技术。
背景技术
舆情,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度。它是社会群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等表现的总和。
随着因特网在全球范围内的飞速发展,网络已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。网络环境下的舆情信息可称为网络舆情,其主要来源有:新闻评论、BBS、聊天室、博客、聚合新闻(RSS)。网络舆情表达快捷、信息多元、方式互动,具备传统媒体无法比拟的优势。因此,基于网络内容的网络舆情发展呈现出以下几个特点:
1.网络上的话题具有突发性,并可在短时间内产生大量的讨论;
2.网络上的话题传播迅速,话题会通过不同的网民很快传播到各个网站;
3.网络上的热点话题会持续较长时间,大量网民会反复地参与到讨论中;
4.网络讨论影响的范围不断扩大,并在一定程度上影响了人们的日常生活。
网络舆情的突发性和快速传播的特性使其成为了社会舆论的一种快速的反应形式,网络舆情已经开始对现实社会产生一定的影响,因此从网络安全的角度来看,需要提前预测网络舆情的发展趋势,并对网络舆情的发展加以引导,这对于社会稳定有着重要的意义。网络热点话题的持续性决定了这些热点话题有一定的时间连续性,因此从时间的角度出发,以网络舆情的数量为单位对网络热点话题的后续发展趋势进行预测。
但是,现有的网络舆情分析方法一般仅具备以下功能:
一、舆情分析功能。这是舆情分析的核心功能,包括:1、热点话题、敏感话题识别,可以根据新闻出处权威度、评论数量、发言时间密集程度等参数,识别出给定时间段内的热门话题。利用关键字布控和语义分析,识别敏感话题;2、倾向性分析,对于每个话题,对每个发信人发表的文章的观点、倾向性进行分析与统计;3、主题跟踪,分析新发表文章、帖子的话题是否与已有主题相同;4、自动摘要,对各类主题,各类倾向能够形成自动摘要;5、突发事件分析,对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势;7、报警系统,对突发事件、涉及内容安全的敏感话题及时发现并报警;8、统计报告,根据舆情分析引擎处理后的结果库生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。
二、自动信息采集功能。根据用户信息需求,设定主题目标,通过网络页面之间的链接关系,从网上自动获取页面信息,并且随着链接不断向整个网络扩展,从而完成信息收集任务。
三、数据清理功能。对收集到的信息进行预处理,如格式转换、数据清理,数据统计。对于新闻评论,需要滤除无关信息,保存新闻的标题、出处、发布时间、内容、点击次数、评论人、评论内容、评论数量等。对于论坛BBS,需要记录帖子的标题、发言人、发布时间、内容、回帖内容、回帖数量等,最后形成格式化信息。
由于现有的网络舆情分析方法仅针对已出现的网络舆情进行分析,并不能对网络舆情的发展趋势进行预测,因此存在这样一种技术需求,即,需要一种快速可靠的网络舆情预测方法来预测网络舆情的发展趋势。
发明内容
为了克服现有技术的不足,本发明提供一种基于时间序列的网络舆情预测方法,该方法包括以下步骤:
A、预处理网络舆情信息,获得进行预测所需的时间序列;
B、根据经预处理获得的所述时间序列,建立相应的预测模型;
C、采用所述预测模型预测网络舆情发展趋势。
根据本方法的一个方面,所述预测模型为ARIMA模型。
根据本方法的一个方面,步骤A中的预处理过程具体包括以下步骤:
A1、采集网络舆情信息并对其进行聚类;
A2、获取热点网络舆情信息;
A3、对所述热点网络舆情信息进行数据聚合,获得为进行预测所需的时间序列。
根据本方法的一个方面,步骤B中具体还包括步骤:
B1、单位根检验;
B2、估计第一参数和第二参数;
B3、检验所述ARIMA模型的有效性。
根据本方法的一个方面,步骤C中的预测结果以数值序列和预测图的形式显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810226293.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轿车涂装中的前罩锁紧支撑
- 下一篇:锤片粉碎机的整体式锤片刀组





