[发明专利]一种ETL数据血统查询系统及查询方法在审
| 申请号: | 201510272289.7 | 申请日: | 2015-05-25 |
| 公开(公告)号: | CN104915390A | 公开(公告)日: | 2015-09-16 |
| 发明(设计)人: | 许飞月;李青海;简宋全;侯大勇;邹立斌 | 申请(专利权)人: | 广州精点计算机科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京隆源天恒知识产权代理事务所(普通合伙) 11473 | 代理人: | 闫冬 |
| 地址: | 510630 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 etl 数据 血统 查询 系统 方法 | ||
技术领域
本发明涉及数据管理领域,特别涉及一种ETL数据血统查询系统及查询方法。
技术背景
随着企业业务范围的扩大,企业需要对各个区域的不同业务的数据进行集成并分析。可以认为,商业智能是对商业信息的搜集、管理和分析过程,目的是使企业的各级决策者获得知识或洞察力,促使他们做出对企业更有利的决策。商业智能一般由数据仓库、联机分析处理、数据挖掘、数据备份和恢复等部分组成。数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。为企业提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制。ETL过程就是构建数据仓库的重要过程。ETL是Extraction Transformation Loading的缩写,中文名称为数据抽取、转换和加载。ETL负责将来自不同系统的,属于同主题的且具有不同数据结构的数据抽取到中间层后进行数据格式的转换和数据内容的清洗,最后加载到数据仓库中,是构建数据仓库非常重要的一环。目前ETL主要过程为转换,我们需要对ETL过程进行监督。目前的ETL过程监督只能单独监督某个中间过程的输出字段和输出预览,不能有效给出整个ETL过程的数据修改情况。这将使得在ETL过程创建完成后非常不易于修改,因为一旦修改其中某个环节,该环节之后的环节都必须单独检查和修正,ETL过程不易于改进。
鉴于上述缺陷,本发明创作者经过长时间的研究和实践终于获得了本发明。
发明内容
为解决上述技术缺陷,本发明采用的技术方案在于,提供一种ETL数据血统查询系统,其特征在于,包括一运行模块与一数据血统管理模块,
所述运行模块能够运行任务脚本、并且能够划分任务形成带有操作信息的任务脚本文件,并将所述带有操作信息的任务划分文件传送至所述数据血统管理模块;
所述数据血统管理模块能够接受用户配置文件,收集源数据文件、带有操作信息的任务脚本文件,对数据血统信息进行存储。
较佳的,所述运行模块包括:
一操作划分单元,用于对任务脚本进行划分、形成带有操作信息的任务脚本文件;
一脚本运行单元:获取源数据与运行带有操作信息的任务划分文件,运行任务;
较佳的,所述数据血统管理模块包括:
一数据血统获取单元,能够发送和接受用户配置文件、获取操作信息的任务脚本文件,将数据血统写入数据血统表与数据血统附属表;
一数据血统存储单元,用于存储所述数据血统表与数据血统附属表。
较佳的,所述数据血统获取单元包括:
一操作信息获取子单元,用于获取用户配置文件、带有操作信息的任务脚本文件与任务源文件;
一字段信息获取子单元,用于获取一次操作的字段信息;
一控制子单元,用于根据所述操作信息获取子单元与所述字段信息获取子单元获取的数据进行判断,确定对应操作对每个字段的行为结果。
较佳的,所述控制子单元能够对当前运行任务进行监控。
较佳的,所述行为结果包括:增行,减行,添加,删除,更新,修改元数据,查询。
较佳的,包括步骤:
S1:用户填写配置文件,所述配置文件由数据血统获取单元获取;
S2:操作划分单元获取ETL任务脚本并对其处理,生成带有操作信息的任务脚本文件;
S3:所述脚本运行单元获取带有操作信息的任务脚本文件进行处理,生成脚本运行文件;
S4:数据血统获取单元获取脚本运行文件、源数据文件进行分析,获取数据血统;
S5:所述数据血统获取单元将数据血统写入数据血统表与数据血统附属表;
S6:所述数据血统获取单元将数据血统表与数据血统附属表存入数据血统存储单元。
较佳的,所述步骤S4具体为:
操作信息获取子单元根据配置文件获取一些列的操作的操作号与SQL语言,字段信息获取子单元获取一次操作所得到的字段。
与现有技术相比较,本发明的有益效果在于:开发人员可以自行设置参数,选择需要查看的数据血统,此装置可以把用户需要的数据血统以图表的方式展示出来。该图表包含了操作的顺序和每个操作对数据的行为。该方法及装置还有出错检测功能,操作出错情况可以显示在上述图表中。此外,用户还可以任意选择任务断点以及查看该断点的数据输出情况及数据血统。
附图说明
图1为本发明中所述ETL数据血统查询系统结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州精点计算机科技有限公司,未经广州精点计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510272289.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:家用水质加热装置
- 下一篇:一种快速冷却的电压力锅
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





