[发明专利]一种数据治理方法、装置、电子设备及可读存储介质在审

专利信息
申请号: 202010528926.3 申请日: 2020-06-11
公开(公告)号: CN111651460A 公开(公告)日: 2020-09-11
发明(设计)人: 陆鹏飞;赵琳 申请(专利权)人: 上海德易车信息科技有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/245;G06F16/248;G06Q10/10
代理公司: 上海硕力知识产权代理事务所(普通合伙) 31251 代理人: 郭桂峰
地址: 200241 上海市闵*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 治理 方法 装置 电子设备 可读 存储 介质
【说明书】:

发明提供了一种数据治理方法、装置、电子设备及可读存储介质,包括:根据所有任务的输入输出关系,获得所有任务的执行顺序;所述输入输出关系为根据一阶段的数据表得到下一阶段的数据表;根据所述执行顺序依次执行各个任务,得到对应阶段的数据表;根据所有阶段的数据表,生成体现数据治理过程的桑基图。本发明大幅减少了人工参与的环节,降低了协作部门的处理要求,提高了整个数据治理的效率;又通过桑基图直观地展示了数据治理中的数据流向,提高了整个数据治理的可视化。

技术领域

本发明涉及数据处理技术领域,尤指一种数据治理方法、装置、电子设备及可读存储介质。

背景技术

随着互联网等信息技术的快速发展,人们可以获得大量的数据。但是这些数据包含的内容杂,使其隐含的数据特征不易被发现,为此需要对这些数据进行分析、优化处理,得到我们所需要的数据。这个过程称为数据治理。

数据治理包括数据的抽取、转换和报表展示,通常需要经过多个串行执行的操作才能得到最终的报表。

现有的数据治理很多仍需要人工方式进行检查和分析数据,还可能需要多个部门进行分工协作,由一个部门完成一部分处理后,再经其他部门在此基础上进一步处理才能得到最终的报表。这种人工分析方式耗时耗力,效率低下;当数据量庞大时,人工操作无法满足需求;多个部门的分工协作又导致数据治理时间长,进一步导致数据治理效率低;当发现最终的报表存在问题时,依靠人工回头查错,查验流程长、效率低。

发明内容

本发明的目的之一是为了克服现有技术中存在的至少部分不足,提供一种数据治理方法、装置、电子设备及可读存储介质。

本发明提供的技术方案如下:

一种数据治理方法,包括:获取每个任务的输入输出关系;根据所有任务的输入输出关系,获得所有任务的执行顺序;根据所述执行顺序依次执行各个任务,得到对应阶段的数据表;根据所有阶段的数据表,生成体现数据治理过程的桑基图。

进一步地,所述的根据所有任务的输入输出关系,获得所有任务的执行顺序,包括:根据所有任务的输入输出关系,获得每个任务的执行依赖;根据每个任务的执行依赖,得到所有任务的执行顺序。

进一步地,所述的根据所有阶段的数据表,生成体现数据治理过程的桑基图,包括:根据所述执行顺序,得到数据表的阶段顺序;以每个阶段为层,以每个阶段的数据表为对应层的节点,按照所述阶段顺序,将多个阶段生成桑基图的多个层。

进一步地,在生成所述桑基图之后,包括:接收查询请求,所述查询请求包括待查询数据表或待查询属性;当收到查询请求时,从所述桑基图中获取与所述查询请求相关的信息并展示。

进一步地,在生成所述桑基图之后,还包括:检查所述桑基图中的数据流动;当出现不符合桑基能量平衡原则的数据流动时,从所述桑基图中获取与所述数据流动相关的信息并告警提示。

本发明还提供一种数据治理装置,包括:关系获取模块,用于获取每个任务的输入输出关系;调度顺序获取模块,用于根据所有任务的输入输出关系,获得所有任务的执行顺序;任务调度模块,用于根据所述执行顺序依次执行各个任务,得到对应阶段的数据表;桑基图生成模块,用于根据所有阶段的数据表,生成体现数据治理过程的桑基图。

进一步地,还包括:查询模块,用于接收查询请求,所述查询请求包括待查询数据表或待查询属性;当收到查询请求时,从所述桑基图中获取与所述查询请求相关的信息并展示。

进一步地,还包括:告警提示模块,用于检查所述桑基图中的数据流动;当出现不符合桑基能量平衡原则的数据流动时,从所述桑基图中获取与所述数据流动相关的信息并告警提示。

本发明还提供一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于运行所述计算机程序时实现前述的数据治理方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海德易车信息科技有限公司,未经上海德易车信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010528926.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top