[发明专利]网络舆情危机预警方法无效
| 申请号: | 201110127509.9 | 申请日: | 2011-05-17 |
| 公开(公告)号: | CN102194001A | 公开(公告)日: | 2011-09-21 |
| 发明(设计)人: | 谌志群;王荣波;姚金良 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络 舆情 危机 预警 方法 | ||
技术领域
本发明属于智能信息处理领域,涉及一种实时的网络舆情危机预警方法。
背景技术
当前互联网已深入千家万户,具有使用面广、传播面广、传播迅速、不受时空限制等特征,能象放大镜一样将信息影响力成倍放大,尤其是一些负面的焦点事件、敏感话题,在互联网上一出现可能会一夕之间家喻户晓,给相关主体造成信任缺失、品牌失信、形象受损、民众反对等不利影响,因此需要开发高效的网络舆情自动处理技术,帮助舆情工作者及时采取措施有效疏导网民情绪、引导舆论走向。我们认为,为实现以上目标,对网络舆情的处理模式应由“事后危机处理”转变为“事前危机预警”,而只有实现对网上热点话题发展趋势的正确判断才能真正实现舆情危机的自动预警。
在舆情危机预警方面,现有技术手段还不多,现有舆情处理系统的一般做法是将热点话题或敏感话题的排行与变化情况以日报、周报或快报等方式提交给舆情工作者,然后由人工来作预警判断,如Goonie网络舆情监控分析系统、TRS互联网舆情管理系统、方正智思互联网信息监控分析系统等。在自动预警技术方面,李弼程等在论文“基于直觉模糊推理的网络舆情预警方法”(计算机应用研究,2010年第9期)中提出借鉴战场态势分析思想,选取了适合计算机实现的七个网络舆情态势分析模式对预警等级进行判断。但这种方法需要的多个参数不易获得,需人工干预,无法完全自动化实现。丁菊玲等在论文“一种面向网络舆情危机预警的观点柔性挖掘模型”(情报杂志,2009年第10期)中初步探讨了构建观点柔性挖掘模型,模拟危机中观点演化过程来预测观点演化趋势,以实现舆情危机预警的可行性。张珏在硕士论文“网络舆情预测模型与平台的研究”(北京交通大学,2009年)中提出采用经济领域的预测模型,如ARIMA模型和BP神经网络模型,来对网络舆情进行预测。以上几种方法还处于探索阶段,还未在实际的网络舆情处理系统中得到应用。
发明内容
本发明的目的是针对现有舆情处理技术的不足,提出一种基于网络舆情内容和网络舆情演化规律的网络舆情发展趋势挖掘与危机自动预警方法。
网络舆情具有突发性、破坏性、紧迫性等特点,面对海量的网络舆情信息,如何在最短的时间内作出分析、研判与决策是至关重要的。现有的基于统计的热点词提取方法需要大量的在线计算,而基于文本分类/聚类的热点话题发现方法计算复杂度过高,直接导致系统实时性难以保证。
本发明的基本思想是尽量减少在线计算量,并采用新的热点话题检测、跟踪与趋势挖掘方法,实现网络舆情危机的实时预警。
本发明的技术方案分为离线部分和在线部分两块。离线部分以一个大规模网络语料库(时间跨度6年的200万篇新浪网页新闻)和一个舆情语料库(从天涯论坛采集整理)为依托,采用统计分析与机器学习方法,分别获取非主题词库和趋势挖掘规则库,为网络热点词提取和热点话题趋势挖掘提供支撑。在线部分首先将实时采集的舆情信息进行预处理,提取纯文本信息,然后在非主题词库支持下,采用两级过滤方法快速提取出热点词。热点词提取后,采用基于共词分析的词聚类方法获取热点话题,接着计算连续时段热点话题之间的相似度,量化热点话题随时间推移而产生的变化情况,实现热点话题的自动跟踪。最后在趋势挖掘规则库支持下,引入模糊推理技术对热点话题进行趋势挖掘操作,获取反映舆情未来发展方向的趋势信息,若满足预警条件则进行自动报警,辅助舆情工作者作出舆情危机处置决策。
本发明的技术方案可解决现有的基于在线统计的热点词获取方法在面对海量网络文本时效率不高的问题,可解决现有的基于文本分类/聚类的热点话题发现方法计算复杂度过高的问题,同时可实现热点话题的自动跟踪和自动预警,以减轻舆情工作者的工作量。
本发明提出的方法经过试验被证明可靠有效,可在舆情信息采集下载后的3分钟内完成对热点话题的检测与趋势挖掘,并给出舆情警示信息。
附图说明
图1为本发明流程框图。
图2为热点词提取流程图。
图3为热点话题发现流程图。
图4为热点话题热度变化语言值隶属函数图。
图5为置信度语言值隶属函数图。
图6为热点话题跟踪与趋势挖掘流程图。
图7a是热点话题趋势图。
图7b是舆情危机预警图。
具体实施方式
为更好理解本发明的技术方案,以下结合附图详细说明本发明的实施方式,本发明总的流程框图见图1。
(1)基于统计分析与机器学习的非主题词库和趋势挖掘规则库获取。
(2)基于两级过滤的网络舆情热点词快速提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110127509.9/2.html,转载请声明来源钻瓜专利网。





