[发明专利]一种网络舆情漏斗式数据采集分析推送系统及方法在审
| 申请号: | 201410730979.8 | 申请日: | 2014-12-05 |
| 公开(公告)号: | CN104408157A | 公开(公告)日: | 2015-03-11 |
| 发明(设计)人: | 吴雪;黄正强;刘明所 | 申请(专利权)人: | 四川诚品电子商务有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
| 地址: | 610042 四川省成都市*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网络 舆情 漏斗 数据 采集 分析 推送 系统 方法 | ||
1.一种网络舆情漏斗式数据采集分析推送系统,包括网络舆情采集模块、网络舆情处理模块和网络舆情发布模块,其特征在于:所述网络舆情采集模块包括定向精确采集子模块和非定向采集子模块,所述定向精确采集子模块,用于采集新闻、论坛、微博、博客、电子报、网络电视舆情高发区的媒体类型站点,保证重要信息第一时间优先采集不丢失;所述非定向采集子模块,用于采集百度、GOOGLE、360当前主流搜索引擎数据,进行舆情数据搜索采集补充,保证了信息收集的全面性;
所述网络舆情处理模块包括热点和敏感话题识别子模块、主题跟踪子模块、自动摘要子模块和综合分析子模块;所述热点和敏感话题识别子模块用于根据系统内设置的与我相关、舆情、正负面三大类关键词词库识别出给定时间段内的热门话题、敏感话题以及正负面舆情信息;所述主题跟踪子模块用于分析新发表文章、帖子的话题是否与已有主题相同;所述自动摘要子模块用于对各类主题,各类倾向形成自动摘要;所述综合分析子模块,用于根据形成的自动摘要,分析某个主题在不同时段间的关注程度,预测发展趋势;对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势;
所述网络舆情发布模块包括舆情预警子模块和多维度舆情信息展示子模块,所述舆情预警子模块用于对突发事件、涉及内容安全的敏感话题及时发现并报警,所述多维度舆情信息展示子模块,用于对舆情分析结果形成简报、报告、图表,自动推送给用户。
2.网络舆情漏斗式数据采集分析推送方法,其特征在于:包括以下步骤:
(1)网络舆情采集:对境内外网络中的新闻网页、论坛、微博、博客、电子报、网络电视舆情高发区的媒体类型站点进行定向精确采集,对百度、GOOGLE、360主流搜索引擎数据进行非定向采集,对采集回的信息进行去重、过滤后存入采集数据库;
(2)网络舆情处理,包括以下子步骤:
S1、系统对采集数据库中的数据进行分析,根据与我相关词库进行分析是否与我相关,分出与我有关的信息和与我无关的信息;
S2、系统对与我有关的信息进行分析,根据舆情词库分析是否属于舆情信息,分出舆情信息和非舆情信息;
S3、系统对舆情信息进行分析,根据本条舆情信息出处的站点级别数、本条舆情正负关键词级别数、本条舆情数据相似度和相关度进行聚类后的总条数,三个数据相乘积得到本条舆情信息的热点值,识别出热点信息和非热点信息;
S4、系统根据正负面词库,采用自然语言智能分词技术,识别出信息的正负面关系,分出负面信息和非负面信息;所述正负面词库包括情感语料库和正负面舆情词典;
S5、系统进行主题跟踪,分析新发布的文章、帖子的话题是否与已有的主题相同;对各类主题形成自动摘要;系统将采集回来的信息进行舆情关键词统计分析出舆情关键词的分布情况并进行关键词聚类处理,对文章标题相似度进行综合分析比较判断生成相似度关联数据,实现对某一事件主题跟踪分析;
S6、系统根据形成的自动摘要,分析某个主题在不同时段间的关注程度,预测发展趋势;系统舆情库中详细记录有每条舆情信息的发布时间,站点和载体信息资料,通过主题跟踪分析算法,分析出某一个事件主题的详细的舆情传播途径以及传播载体,统计出舆情在什么时间段和什么载体上所出现的频率以及概率值,生成一个直观的舆情发展趋势图;
S7、系统对突发事件进行跨时间、跨空间综合分析,系统将每条采集回来的舆情数据进行聚类整合分析出舆情正负面级别、发布在各站点时间、发布在各站点的频率以及根据发布时间形成的时间和站点的舆情传播途径这些热点因素,并按照突发舆情事件的性质、严重程度、扩散速度、影响范围、持续时间要素自动将突发舆情事件分为特别重大舆情事件、重大舆情事件、较大舆情事件和一般舆情事件;
S8、系统根据突发舆情事件的级别,进行舆情预警;
(3)网络舆情发布:系统透过图表分析趋势,掌握潜在的变化规律,对舆情分析结果形成简报、报告、图表等方式,自动推送给用户所关心的舆情信息。
3.根据权利要求2所述的网络舆情漏斗式数据采集分析推送方法,其特征在于:步骤(1)所述的采集方法是采用互联网信息采集、文本挖掘技术和全文检索技术采集信息。
4.根据权利要求2所述的网络舆情漏斗式数据采集分析推送方法,其特征在于:步骤(2)所述的舆情预警包括短信预警、邮件预警、弹窗预警。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川诚品电子商务有限公司,未经四川诚品电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410730979.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:关键词排名的展示方法和装置
- 下一篇:一种电子地图搜索系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





