[发明专利]数据治理方法、装置、设备及存储介质在审
| 申请号: | 202011207921.7 | 申请日: | 2020-11-03 |
| 公开(公告)号: | CN112307004A | 公开(公告)日: | 2021-02-02 |
| 发明(设计)人: | 刘邺超 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/2455;G06F16/28 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
| 地址: | 518027 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 治理 方法 装置 设备 存储 介质 | ||
本发明涉及大数据领域,公开了一种数据治理方法、装置、设备及存储介质。所述数据治理方法包括:对数据仓库内所有源数据进行预处理,所述预处理包括数据标注;根据各源数据对应的数据标签,配置具有多种计算粒度和多种运算规则的指标集,所述指标集中每个指标对应一个或多个数据标签;根据所述指标集中各指标,生成多条计算任务,所述计算任务包括离线计算任务与实时流计算任务;执行各计算任务,以根据各指标对应的计算粒度和运算规则,对各指标对应数据标签的源数据进行计算,得到指标数据;根据预置数据存储规则,对各指标数据进行分类存储。本发明采用标签对源数据进行管理,使得繁多的指标不再无序、单一,指标管理更加方便高效。
技术领域
本发明涉及大数据领域,尤其涉及一种数据治理方法、装置、设备及存储介质。
背景技术
数据治理是指对数据的全生命周期进行管理,包含数据采集、清洗、转换等传统数据集成和存储环节的工作,同时还包含数据资产目录、数据标准、质量、安全、数据开发、数据价值、数据服务与应用等,整个数据生命期而开展开的业务、技术和管理活动都属于数据治理范畴。
随着大数据技术和应用的发展,促使传统行业需要将海量的业务数据向大数据平台迁移,在这个过程中,数据治理的重要性日益明显,通过有效的数据治理可以明显提高数据处理的效率。目前,数据治理一般需要由专业的技术人员来进行数据清洗、去重、映射等一系列的操作,效率不高且容易出错,这不仅对技术人员的技术要求较高,而且对技术人员在业务层面的要求也非常高,不利于传统行业的效率提升。
发明内容
本发明的主要目的在于解决现有数据治理效率低的技术问题。
本发明第一方面提供了一种数据治理方法,所述数据治理方法包括:
对数据仓库内所有源数据进行预处理,所述预处理包括数据标注;
根据各源数据对应的数据标签,配置具有多种计算粒度和多种运算规则的指标集,其中,所述指标集中每个指标对应一个或多个数据标签;
根据所述指标集中各指标,生成多条计算任务,其中,所述计算任务包括离线计算任务与实时流计算任务;
执行所述各计算任务,以根据所述各指标对应的计算粒度和运算规则,对所述各指标对应数据标签的源数据进行计算,得到指标数据;
根据预置数据存储规则,对所述各指标数据进行分类存储。
可选的,在本发明第一方面的第一种实现方式中,所述根据各源数据对应的数据标签,配置具有多种计算粒度和多种运算规则的指标集包括:
获取各源数据对应的数据标签;
分别将各数据标签与预置指标配置规则进行匹配;
若匹配成功,则基于匹配的指标配置规则,将匹配到的数据标签与对应指标绑定;
根据指标配置规则、数据标签与指标的绑定关系,构建各数据标签对应的具有多种计算粒度和多种运算规则的指标集。
可选的,在本发明第一方面的第一种实现方式中,所述根据所述指标集中各指标,生成多条计算任务包括:
获取所述指标集中各指标;
根据所述指标集中各指标,对应生成多条计算任务;
根据各指标的时效要求,确定各计算任务的执行方式,其中,所述执行方式包括离线执行与实时执行。
可选的,在本发明第一方面的第一种实现方式中,所述执行所述各计算任务,以根据所述各指标对应的计算粒度和运算规则,对所述各指标对应数据标签的源数据进行计算,得到指标数据包括:
获取待执行的计算任务;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011207921.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





