[发明专利]构建全链路的方法、装置、设备和计算机可读存储介质在审
| 申请号: | 202210447066.X | 申请日: | 2022-04-26 |
| 公开(公告)号: | CN114896265A | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 李城军;于洋;高经郡 | 申请(专利权)人: | 北京科杰科技有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/245;G06F16/2455 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100020 北京市朝阳区阜*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 构建 全链路 方法 装置 设备 计算机 可读 存储 介质 | ||
本申请的实施例提供了构建全链路的方法、装置、设备和计算机可读存储介质。所述方法包括获取SQL语句;对所述SQL语句进行预处理,得到规则化的SQL语句;解析所述规则化的SQL语句,得到构建所述SQL语句的最小单元,基于所述最小单元,构建中心表上下游的全链路。以此方式,可构造出体现表与字段与任务之间的关系的全链路。
技术领域
本申请的实施例涉及数据分析领域,尤其涉及构建全链路的方法、装置、设备和计算机可读存储介质。
背景技术
数据血缘分析是元数据管理和数据治理工具的核心功能,通过建立数据之间的血缘关系(链路),可以分析上游数据发生变化是否影响下游关联的数据;通过分析数据血缘可以更好的理解数据和使用数据。
但是,通过现有方式构建的血缘关系,对于环境的依赖性比较强,部分产品为插件,需要在集群上安装使用,不够轻量化;对于db类型支持的不够全面;仅有对表或者字段血缘的关系,没有表与字段与任务之间的关系。
发明内容
根据本申请的实施例,提供了一种构建全链路的方案。
在本申请的第一方面,提供了一种构建全链路的方法。该方法包括:
获取SQL语句;
对所述SQL语句进行预处理,得到规则化的SQL语句;
解析所述规则化的SQL语句,得到构建所述SQL语句的最小单元,基于所述最小单元,构建中心表上下游的全链路。
进一步地,所述获取SQL语句包括:
通过钩子函数获取任务中封装的aql语句。
进一步地,所述对所述SQL语句进行预处理,得到规则化的SQL语句包括:
对所述SQL语句进行注释处理、自定义变量处理和/或兼容语法处理,得到规则化的SQL语句。
进一步地,所述解析所述规则化的SQL语句,得到构建所述SQL语句的最小单元包括:
解析所述规则化的SQL语句,得到构建所述SQL语句的输入表、输入表字段、任务信息、输出表和数据表字段。
在本申请的第二方面,提供了一种构建全链路的装置。该装置包括:
获取模块,用于获取SQL语句;
优化模块,用于对所述SQL语句进行预处理,得到规则化的SQL语句;
构建模块,用于解析所述规则化的SQL语句,得到构建所述SQL语句的最小单元,基于所述最小单元,构建中心表上下游的全链路。
进一步地,所述获取SQL语句包括:
通过钩子函数获取任务中封装的aql语句。
进一步地所述对所述SQL语句进行预处理,得到规则化的SQL语句包括:
对所述SQL语句进行注释处理、自定义变量处理和/或兼容语法处理,得到规则化的SQL语句。
进一步地,所述解析所述规则化的SQL语句,得到构建所述SQL语句的最小单元包括:
解析所述规则化的SQL语句,得到构建所述SQL语句的输入表、输入表字段、任务信息、输出表和数据表字段。
在本申请的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
在本申请的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本申请的第一方面的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科杰科技有限公司,未经北京科杰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210447066.X/2.html,转载请声明来源钻瓜专利网。





