[发明专利]一种舆情数据处理系统在审
申请号: | 201810403516.9 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108628994A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 张郭强;余虎;陈一鸣;伍景润;倪峥;余超杰 | 申请(专利权)人: | 广东亿迅科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 冯筠 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据模型 数据处理系统 基础数据 可视化单元 数据集单元 获取单元 数据可视化 数据分类 数据支持 保证 | ||
本发明公开了一种舆情数据处理系统,包括获取单元,数据集单元,数据模型单元,可视化单元;获取单元,用于获取舆情数据;数据集单元,用于将获取到的舆情数据按照数据分类标准,构建成基础数据集;数据模型单元,利用上述的基础数据集,建立不同类型的数据模型;可视化单元,用于将上述的数据模型进行数据可视化处理。本发明一种舆情数据处理系统,能够全面的获取舆情数据,弥补了人工获取舆情数据的不足,由于根据基础数据集而建立了不同类型的数据模型,保证了经过处理后的舆情数据趋近于用于真实的舆情数据,避免了虚假舆情数据的出现,对政府获取民意数据、掌握社会民意和正确引导舆论提供了重要的数据支持。
技术领域
本发明涉及舆情数据的处理,更具体地说是一种舆情数据处理系统。
背景技术
“舆情”是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。
目前,获取舆情数据的方法主要是通过人工的方式获取互联网中用户发布的舆情信息,然后通过关键字匹配算法,进行信息的过滤与筛选,随后再通过人工的方式进行信息确认。但随着互联网的发展,互联网中有着大量的数据,采用传统的人工采集数据方式,显然难以胜任。也有通过关键字、敏感词等,对互联网海量信息进行自动抓取,实现用户的网络舆情监测和新闻专题追踪等信息需求,但并不能识别互联网中的虚假舆情或者利益群体刻意制造的舆情信息。
发明内容
本发明的目的在于克服现有技术的不足,提供一种舆情数据处理系统。
为实现上述目的,本发明采用以下技术方案:一种舆情数据处理系统,包括获取单元,数据集单元,数据模型单元,可视化单元;
所述获取单元,用于获取舆情数据;
所述数据集单元,用于将获取到的舆情数据按照数据分类标准,构建成基础数据集;
所述数据模型单元,利用上述的基础数据集,建立不同类型的数据模型;
所述可视化单元,用于将上述的数据模型进行数据可视化处理。
其进一步技术方案为:所述获取单元包括:
信息采集模块,用于收集互联网中的舆情源信息;
清洗模块,用于对舆情源信息进行过滤、清除处理;
数据仓库模块,用于存储处理后的舆情源信息;
数据接口模块,用于传递所存储的舆情源信息。
其进一步技术方案为:所述数据集单元包括:
数据接收模块,用于接收数据接口模块中存储的舆情源信息;
预处理模块,对接收到的舆情源信息进行预处理,形成完整有序的数据集。
其进一步技术方案为:所述的对接收到数据按照不同的分类标准进行分类,分类标准包括网络行为标准、服务内行为标准、用户内容偏好标准和用户交易标准。
其进一步技术方案为:所述的数据模型单元包括:
主题聚类模块,用于从基础数据集中提取多个关键词,并从这些关键词中聚类出一个或者多个专题事件;
事件挖掘模块,用于对某一目标事件进行多个维度解析,得到该目标事件的事件特征库。
其进一步技术方案为:所述的用于从基础数据集中提取多个关键词,并从这些关键词中聚类出一个或者多个专题事件,提取的关键词包括维稳主题、环境保护、食品安全。
其进一步技术方案为:所述主题聚类模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东亿迅科技有限公司,未经广东亿迅科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810403516.9/2.html,转载请声明来源钻瓜专利网。