[发明专利]一种大数据平台在审
| 申请号: | 202011295080.X | 申请日: | 2020-11-18 |
| 公开(公告)号: | CN112632135A | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 石海龙 | 申请(专利权)人: | 北京天源迪科信息技术有限公司 |
| 主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F16/21;G06F16/215;G06F16/22;G06F21/62;G06F16/25 |
| 代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 姜楠楠 |
| 地址: | 100080 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 平台 | ||
本申请公开了一种大数据平台,包括:统一鉴权与访问控制模块,用于为各模块提供统一的帐号管理、身份认证以及用户授权服务;数据集成模块,采用Kettle和DataX实现数据集成;统一调度模块,实现各模块之间任务的统一调度;数据治理模块,用于进行主数据管理、元数据管理、数据质量管理以及数据标准管理;数据开发平台模块,用于建设统一访问层、对数据库进行管理、进行脚本在线编写、管理并维护开发所生成的脚本;数据分析模块;数据安全模块;数据服务模块,用于建设统一访问层,提供数据表查看预览、查询语句执行的功能,以及依据表名或查询语句定制REST服务、并进行服务发布;运营监控模块,以及平台门户管理模块。
技术领域
本申请涉及一种大数据平台。
背景技术
大数据平台是指以处理海量数据存储、计算及不间断流数据实时计算等场景为主的一套基础设施。典型的包括Hadoop系列、Spark、Storm、Flink以及Flume/Kafka等集群。
随着大数据生态的完善,众多开源组件如雨后春笋般层出不穷。开源组件采用的技术栈不同,在功能上各有侧重,不同组件如同一个个孤岛,缺少协作,给使用者带来极大的不便。
发明内容
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
根据本申请的一个方面,提供了一种大数据平台,包括:
统一鉴权与访问控制模块,用于为各模块提供统一的帐号管理、身份认证以及用户授权服务;
数据集成模块,采用Kettle和DataX实现数据集成;
统一调度模块,包括若干个控制节点和若干个工作节点,所述控制节点用于实现任务的调度控制,所述工作节点用于根据所述控制节点下发的指令执行具体任务,并将执行结果反馈给所述控制节点;
数据治理模块,用于进行主数据管理、元数据管理、数据质量管理以及数据标准管理;
数据开发平台模块,用于建设统一访问层、对数据库进行管理、进行脚本在线编写、管理并维护开发所生成的脚本;
数据分析模块,用于从数据源中采集数据,根据所搭建的数据分析模型对采集到的数据进行分析,并通过可视化的方式展现各数据分析模型的分析结果;
数据安全模块,用于对访问大数据平台集群以及其中数据的用户和应用进行限制,记录数据来源、使用情况和销毁情况,对数据进行加密和脱敏,对多租户进行隔离,对数据进行侵权保护,以及容灾管理;
数据服务模块,用于建设统一访问层,提供数据表查看预览、查询语句执行的功能,以及依据表名或查询语句定制REST服务、并进行服务发布;
运营监控模块,用于对系统资源的使用情况和服务/调度任务的运行状态进行监控,并且在出现异常时触发报警;和
平台门户管理模块,用于对平台门户进行管理。
可选地,所述统一鉴权模块以开源软件keycloak作为用户权限的实际载体,通过对原生keycloak管理接口进行代理和聚合来形成API能力集;同时保留对原生API的访问。
可选地,所述的数据集成模块包括:
数据源管理子模块,用于维护多个数据源的连接信息,以及验证所述连接的有效性;
数据预览子模块,用于实现对多种数据源内的表结构的查看,以及TOP-N数据的查看;和
任务管理子模块,用于对数据同步任务、数据清洗任务以及数据转换任务的管理。
可选地,所述数据治理模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天源迪科信息技术有限公司,未经北京天源迪科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011295080.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





