[发明专利]一种基于互联网开放信息的事件发生风险预测并预警方法有效
申请号: | 201210501872.7 | 申请日: | 2012-11-29 |
公开(公告)号: | CN103854063B | 公开(公告)日: | 2017-04-05 |
发明(设计)人: | 杨风雷;黎建辉 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 余长江 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 互联网 开放 信息 事件 发生 风险 预测 预警 方法 | ||
技术领域
本发明属于信息技术领域,尤其涉及一种对爬取得到的互联网信息进行特定处理,之后对特定区域发生特定事件的风险进行预测并进行预警的方法,主要应用于食品安全信息监控、风险预警等非常规突发事件的应急处理工作中。
背景技术
近年来,食品安全事件诸如毒胶囊、回锅油、瘦肉精、染色馒头、塑化剂、毒黄瓜等频频发生,这既造成了极坏的社会影响,也带来了大量的经济损失。为了避免或最大限度的降低这些食品安全事件所带来的危害,基于事件的风险预警技术开始得到了极大关注。为进行基于事件的风险预警,这就需要提前发现这些事件的信息。
随着Internet的迅猛发展,互联网网民数量越来越庞大,互联网逐渐成为网民发布信息、获取信息和传递信息的主要载体,而且通过人、组织等之间的交互形成了一个和现实社会有一定的对应、关联关系的虚拟社会。它已经变成了世界上规模最大的公共数据源,而且其规模还正在不停的增长着。此状况下,利用互联网自身的特点,建立起完善的社会信息反馈网络,提前发现各种可能带来危机的“未然”因素,为食品安全事件的应急管理提供及时、准确、全面的信息就显得势在必行和有着非常重要的意义。
从现实的角度看,注意到多数食品安全事件发生前,在互联网上总是已经存在一些零星的线索,为此,可以采取采集、分析互联网上的相关信息后以预警的方式为这些食品安全事件的应急管理提供直接的信息来源。为及时、准确、全面获取、掌握所需要的特定互联网目标信息,就需要用到互联网信息分析和预警等相关技术。
比如有研究工作利用互联网信息进行风险预警,但该研究中对收集的信息如何处理,采取何种措施,都需要人工的参与和决定。也有研究工作可以自动的基于互联网信息针对添加剂和补充剂等进行食品安全风险预警,但其存在一些不足:过程中没有考虑信息的质量问题,没有对采集的垃圾信息进行过滤-这会影响预警的准确性;事件信息发现过程中直接将经过关键词匹配后得到的类别信息作为同一种事件信息的做法中可能存在信息对应的主体不一致等。从实际的测试结果看,其信息分类、预警的准确性、全面性等方面尚存在需要进一步提高的地方。
同时,在通过事件信息发现方法提取出相关区域所发生的事件信息后,如果能对特定区域(当前未发生)发生特定事件的风险进行预测,即对其是否会发生此种事件,以及多长时间后可能会发生等进行预测并预警,将对特定区域的风险监测和预警有着非常重要的意义。通过查阅文献,尚未发现此类研究。
发明内容
为解决上述的问题,本发明的目的在于提供一种采取特定步骤对网页信息的内容进行分析,之后对特定区域发生特定事件的风险进行预测并预警的方法。方法中借鉴智能系统思路,形成的步骤如下所述。
1.网页信息爬取
选用互联网信息爬虫软件(比如Heritrix、Nutch等)对信息源中的网页信息进行爬取,爬取过程中基于有限范围爬取、垂直爬取等技术尽可能得到所需要的互联网网页信息并进行保存。
2.垃圾信息过滤
为提高进入后续处理过程中的信息质量,对爬取得到的网页信息进行垃圾过滤。过滤过程中主要是对通过内容、链接作弊的垃圾信息、以及用户生成内容中的无关意见、低质量意见和欺骗性垃圾意见通过建立的检测模型进行过滤。从而保证进入后续过程的信息的质量。
3.区域信息发现
在上述垃圾信息过滤基础上,对爬取的网页信息的标题、内容等进行地名代词等解析后,采取模式匹配、基于机器学习判断模型的判断识别方法进行信息相关区域的发现确定。
4.区域事件预警
对信息进行食品安全信息过滤、对象信息发现后,在建立表示区域事件的特征参数诸如页面数、页面浏览数、综合指数等的基础上,通过定期计算事件特征参数值的方法对事件的发展趋势进行追踪;并对事件当前的各特征参数值和其之前一定时期内的均值进行比较,如果差值为正且绝对值持续大于一定的阈值,则进行区域事件预警。
5.目标区域事件发生风险预测和预警
基于已经发生特定事件的区域分布,采用矩阵分解和logistic回归分析的方法,对目标区域是否会发生特定事件以及可能的发生时间等进行分析和预测,并根据预测结果进行不同的风险预警。
6.结果展示和服务
在对目标区域特定事件是否发生、何时发生进行预测、预警分析的基础上,将分析得到的结果通过表格、图等的方式展示给用户。并提供短信息、邮件等即时送发的服务方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210501872.7/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置