[发明专利]一种舆情数据处理系统在审
申请号: | 201810403516.9 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108628994A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 张郭强;余虎;陈一鸣;伍景润;倪峥;余超杰 | 申请(专利权)人: | 广东亿迅科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 冯筠 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据模型 数据处理系统 基础数据 可视化单元 数据集单元 获取单元 数据可视化 数据分类 数据支持 保证 | ||
1.一种舆情数据处理系统,其特征在于,包括获取单元,数据集单元,数据模型单元,可视化单元;
所述获取单元,用于获取舆情数据;
所述数据集单元,用于将获取到的舆情数据按照数据分类标准,构建成基础数据集;
所述数据模型单元,利用上述的基础数据集,建立不同类型的数据模型;
所述可视化单元,用于将上述的数据模型进行数据可视化处理。
2.根据权利要求1所述的一种舆情数据处理系统,其特征在于,所述获取单元包括:
信息采集模块,用于收集互联网中的舆情源信息;
清洗模块,用于对舆情源信息进行过滤、清除处理;
数据仓库模块,用于存储处理后的舆情源信息;
数据接口模块,用于传递所存储的舆情源信息。
3.根据权利要求2所述的一种舆情数据处理系统,其特征在于,所述数据集单元包括:
数据接收模块,用于接收数据接口模块中存储的舆情源信息;
预处理模块,对接收到的舆情源信息进行预处理,形成完整有序的数据集。
4.根据权利要求1所述的一种舆情数据处理系统,其特征在于,所述的对接收到数据按照不同的分类标准进行分类,分类标准包括网络行为标准、服务内行为标准、用户内容偏好标准和用户交易标准。
5.根据权利要求1所述的一种舆情数据处理系统,其特征在于,所述的数据模型单元包括:
主题聚类模块,用于从基础数据集中提取多个关键词,并从这些关键词中聚类出一个或者多个专题事件;
事件挖掘模块,用于对某一目标事件进行多个维度解析,得到该目标事件的事件特征库。
6.根据权利要求5所述的一种舆情数据处理系统,其特征在于,所述的用于从基础数据集中提取多个关键词,并从这些关键词中聚类出一个或者多个专题事件,提取的关键词包括维稳主题、环境保护、食品安全。
7.根据权利要求5所述的一种舆情数据处理系统,其特征在于,所述主题聚类模块包括:
匹配模块,用于对主题事件中的关键词进行工单匹配;
过滤模块,用于对工单匹配后形成的样例文本过滤;
核对模块,用于对过滤后的样例文本进行校对;
训练模块,用于通过机器学习方式对样例文件进行训练,得到样本集;
聚类分析模块,用于通过对样本集做基于LDA的文本主题挖掘,形成专题数据集;
迭代模块,用于对得到的专题数据集进行迭代优化处理。
8.根据权利要求5所述的一种舆情数据处理系统,其特征在于,所述的用于对某一目标事件进行多个维度解析,得到该目标事件的事件特征库,其中的维度包括事件主体、主题特征、情绪特征、发生时间特征、发生位置特征、受理部门。
9.根据权利要求1所述的一种舆情数据处理系统,其特征在于,所述可视化单元包括:
建模模块,用于将得到的数据映射成物体的几何图元;
渲染模块,用于将几何图元描绘成图形;
显示模块,用于通过显示设备展示相关图形。
10.根据权利要求1所述的一种舆情数据处理系统,其特征在于,还包括业务处理单元,用于对数据模型中的数据信息进行分析、跟踪、和预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东亿迅科技有限公司,未经广东亿迅科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810403516.9/1.html,转载请声明来源钻瓜专利网。