[发明专利]数据分析方法、系统、电子设备和存储介质在审
| 申请号: | 202211230948.7 | 申请日: | 2022-09-30 |
| 公开(公告)号: | CN115576930A | 公开(公告)日: | 2023-01-06 |
| 发明(设计)人: | 周雪刚;任英豪 | 申请(专利权)人: | 北京新致君阳信息技术有限公司 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/23;G06F16/2458;G06F16/25 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
| 地址: | 100082 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 分析 方法 系统 电子设备 存储 介质 | ||
1.一种数据分析方法,其特征在于,包括:
抽取数据源数据库的日志数据集;
对所述日志数据集进行第一数据处理后存储至doris数据库;
根据所述第一数据处理后的日志数据集对所述doris数据库保存的数据集合进行更新,并对更新后的所述数据集合进行数据分析得到数据分析结果。
2.根据权利要求1所述的方法,其特征在于,所述抽取数据源数据库的日志数据集前,所述方法还包括:
获取所述数据源数据库中存储的全部源数据;
对所述源数据进行第二数据处理后添加至所述doris数据库中,形成所述数据集合。
3.根据权利要求2所述的方法,其特征在于,所述对所述源数据进行第二数据处理,包括:
对所述源数据进行抽取,形成csv文件;
使用spark工具对所述csv文件形式的所述源数据进行数据规范化处理,所述数据规范化处理包括数据清洗、数据整合、数据合并、数据转化中的任意一种或多种。
4.根据权利要求1所述的方法,其特征在于,所述抽取数据源数据库的日志数据集,包括:
使用变更数据捕获技术和/或OGG技术从所述数据源数据库中抽取所述日志数据集。
5.根据权利要求1所述的方法,其特征在于,所述对所述日志数据集进行第一数据处理后存储至doris数据库,包括:
预设Kafka消息队列,并创建若干Kafka Topic;
对所述日志数据集进行分类得到若干子类日志数据集;
将所述若干子类日志数据集一一对应的添加至所述若干Kafka Topic中;
将所述若干子类日志数据集经由所述若干Kafka Topic存储至所述doris数据库。
6.根据权利要求5所述的方法,其特征在于,所述将所述若干子类日志数据集一一对应的添加至所述若干Kafka Topic中前,所述方法还包括:
启动spark streaming任务;
将所述若干子类日志数据集分别经由所述spark streaming任务进行数据规范化处理,所述数据规范化处理包括数据清洗、数据整合、数据合并、数据转化中的任意一种或多种。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述日志数据集为所述数据源数据库的binlog日志数据集。
8.一种数据分析系统,其特征在于,包括:
数据接入模块,所述数据接入模块用于抽取数据源数据库的日志数据集;
数据处理模块,所述数据处理模块用于对所述日志数据集进行第一数据处理;
doris数据库,所述doris数据库用于接收所述第一数据处理后的日志数据集,并根据所述日志数据集对所述doris数据库保存的数据集合进行更新,并对更新后的所述数据集合进行数据分析得到数据分析结果;
通信模块,所述通信模块用于将所述数据分析结果发送至预设终端进行显示。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的数据分析方法。
10.一种存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行实现权利要求1至7中任意一项所述的数据分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新致君阳信息技术有限公司,未经北京新致君阳信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211230948.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





