[发明专利]数据准确性的校验方法及装置有效
申请号: | 201210031020.6 | 申请日: | 2012-02-10 |
公开(公告)号: | CN103246574A | 公开(公告)日: | 2013-08-14 |
发明(设计)人: | 邓浩 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F11/00 | 分类号: | G06F11/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明;余刚 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 准确性 校验 方法 装置 | ||
技术领域
本申请涉及数据处理领域,具体而言,涉及一种数据准确性的校验方法及装置。
背景技术
随着数据仓库规模的扩大,应用的不断增多,数据间的依赖关系也越来越复杂,一个统计报表/绩效指标,都可能需要来源于多个数据表,并经过多层转换,才能计算得到。同时,数据在企业的日常运营中发挥的作用越来越大,而业务部门应用数据时对数据的首要要求是准确,不准确的数据非但不能辅导运营,提升业务效率,还有可能会误导业务部门,以致做出错误决策。
因为数据计算的复杂性,数据出错的机率相对比较大,而数据的使用方不会接受计算错误的数据,因而对数据计算结果进行监控,校验,确保提供正确的结果是非常重要的。
目前,一般的数据仓库系统会编写一些数据校验脚本,对计算得到的数据进行校验,这些脚本以数据监控任务方式单独放到调度系统中运行,数据监控任务一般不影响或干涉数据提取、转换和加载(Extraction-Transformation-Loading,简称为ETL)工作流的运行。当校验得出计算结果有异常时,后续再由工程师查找原因,进行数据的回滚计算操作。
对于上述的数据准确性(或者,称作数据质量)的校验方法,通常存在以下几个问题:
首先,由于ETL任务与数据校验任务分离,数据校验的结果只是作为事后进行故障排查分析的参考,并不能有效地隔离某项数据错误给整个系统带来的影响,因而造成监控处理不够及时,事后的处理成本较高。
其次,由于进行数据校验的业务逻辑脚本分散的封装在各个数据校验任务脚本中,重复编写,维护不便,进而造成同类数据校验程序并存,没有通用性。
此外,现有的数据准确性校验规则较简单,通常只考虑与源表对比行数,对基于商业指标的监控,考虑较少。
针对现有技术中的数据准确性的校验方法往往造成监控处理不够及时的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种数据准确性的校验方法及装置,以解决现有技术中的数据准确性的校验方法往往造成监控处理不够及时的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种数据准确性的校验方法。
根据本申请的数据准确性的校验方法包括:获取与目标表相关的校验规则信息,其中,目标表为需要进行数据准确性校验的目标数据表;利用与目标表相关的校验规则信息对目标表进行数据准确性校验;以及根据校验结果输出不同的提示信息。
进一步地,获取与目标表相关的校验规则信息包括:在校验规则配置表中获取与第一目标表相关的校验规则信息;以及在校验规则配置表中获取与第二目标表相关的校验规则信息,其中,在校验规则配置表中配置有与多个目标表相关的校验规则信息。
进一步地,上述方法还包括:接收用户输入的校验规则信息;以及根据接收的校验规则信息对校验规则配置表中的校验规则信息进行更新。
进一步地,在利用目标表相关的校验规则信息对目标表进行数据准确性校验之后,方法还包括:将校验结果记录在校验日志表中。
进一步地,利用与目标表相关的校验规则信息对目标表进行数据准确性校验包括:根据校验规则信息生成目标数据指标值查询程序;根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;根据校验规则信息生成基准数据指标值查询程序;根据基准数据指标值查询程序对目标表进行查询,得到基准数据指标值;对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验。
进一步地,利用与目标表相关的校验规则信息对目标表进行数据准确性校验包括:根据校验规则信息生成目标数据指标值查询程序;根据目标数据指标值查询程序对目标表进行查询,得到目标数据指标值;以及对目标数据指标值与基准数据指标值进行比较以对目标表进行数据准确性校验,根据校验结果输出不同的提示信息包括:判断目标数据指标值与基准数据指标值的差值是否大于等于第一预定阈值;在目标数据指标值与基准数据指标值的差值大于等于第一预定阈值时,返回校验失败信息并输出第一告警信息;在目标数据指标值与基准数据指标值的差值小于第一预定阈值时,判断目标数据指标值与基准数据指标值的差值是否大于等于第二预定阈值,其中,第二预定阈值小于第一预定阈值;在目标数据指标值与基准数据指标值的差值小于第二预定阈值时,返回校验成功信息;以及在目标数据指标值与基准数据指标值的差值大于等于第二预定阈值时,返回校验成功信息并输出第二告警信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210031020.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于机器人的旋涡泵的组合支撑架
- 下一篇:二位二通切换阀
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置