[发明专利]一种基于元数据的数据质量管理方法及系统有效

专利信息
申请号: 201410013537.1 申请日: 2014-01-10
公开(公告)号: CN103699693A 公开(公告)日: 2014-04-02
发明(设计)人: 张诗军;王志英;吕华辉;邹庆;罗四夕;罗念华;朱州;刘学仪;曹军;葛松;袁捷;关志伟;陈健欣 申请(专利权)人: 中国南方电网有限责任公司;贵州电网公司信息通信分公司;广东卓维网络有限公司;贵州广思信息网络有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 谭英强
地址: 510627 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 质量管理 方法 系统
【说明书】:

技术领域

发明涉及一种数据处理方法,尤其是一种基于元数据的数据质量管理方法及系统。

背景技术

随着信息化技术的发展,产生了越来越多的数据信息,数据从计划、获取、存储、共享、维护、应用、消亡整个生命周期里可能会引发各类数据质量问题。错误的数据将会对企业的运营、决策造成严重的不良后果,因此数据质量管理已成为企业信息化建设中至关重要的环节。

目前业界缺少一种完整的数据质量管理解决方案,通常都要数据库管理员编写程序脚本来识别存在问题的数据。这种方法的优点是简单、不需部署额外的系统,缺点是不规范、可维护性差、容易出错、不能监控问题数据整改情况。还有种做法是使用规章制度来规范数据录入数据工作,这种规章制度在一定程度上能防止缺陷数据进入数据库,但操作人员的技能水平、责任感、操作失误等都会产生数据质量问题。

无论是使用程序脚本还是规章制度都不能自动地对问题数据进行识别、度量和报警。当有成千上万条数据质量规则需要校验时,这种依靠人工干预才能完成的方式已不能满足需求。

举例来说,大型企业在数据管理工作方面往往存在以下问题:

1.缺乏统一管理,各业务系统或各分子公司的数据管理方式和方法差异较大,水平参差不齐;

2.数据源不唯一,按系统边界进行数据管理,系统间数据冗余导致数据多头管理,数据一致性较差;

3.责任不明确,数据的管理、录入、使用责任没有落实到具体部门和岗位;

4.缺乏企业资源统一建模,人、财、物等企业资源数据模型不统一,导致数据整合和集成的难度较大;

5.数据标准执行不到位,已有业务系统没有全面固化和遵守数据规范,存在信息分类编码不一致、业务含义不统一的现象。

发明内容

针对以上现有技术的缺陷,本发明的目的在于提供一种完整的数据质量管理解决方案,

本发明的技术方案为:

一种基于元数据的数据质量管理方法,包括以下步骤:

1)根据数据库内数据建立统一数据模型;

2)根据建立的数据模型配置元数据;

3)通过解析元数据设置的业务特征和管理特征结果生成校验规则;

4)配置执行策略,每一执行策略绑定一个或多个校验规则;

5)按计划自动执行策略,在目标数据库中查找并存储目标数据;

6)生成报告并分发。

作为以上技术方案的一种改进,步骤3)还包括导出含有校验规则的离线包,其中的校验规则包括数据完整性校验规则和数据合规性校验规则。

作为以上技术方案的一种改进,还包括以下步骤:与上次执行策略查找到目标数据进行对比,分析并标记出本次查找到的目标数据中已经整改的数据。

本发明还提出一种基于以上方法的系统,包括:

数据模型模块,根据数据库内数据建立统一数据模型;

元数据配置模块,根据建立的数据模型配置元数据;

校验规则生成模块,通过解析元数据设置的业务特征和管理特征结果生成校验规则;

策略配置模块,配置执行策略,每一执行策略绑定一个或多个校验规则;

执行引擎,按计划自动执行策略,在目标数据库中查找并存储目标数据;

报告生模块,生成报告并分发。

作为以上技术方案的一种改进,校验规则生成模块导出含有校验规则的离线包,其中的校验规则包括数据完整性校验规则和数据合规性校验规则。

作为以上技术方案的一种改进,还包括比较标记模块,将本次查找到的目标数据与上次执行策略查找到目标数据进行对比,分析并标记出本次查找到的目标数据中已经整改的数据。

本发明的有益效果在于:

数据质量管理基于元数据进行,通过解析元数据设置的业务特征和管理特征结果,实现了数据完整性校验规则和数据合规性校验规则的自动生成。同时,系统能把校验规则导出离线包功能,支撑业务系统或主数据管理系统的数据质量管理需求;此外,系统支持数据质量校验规则的自动以及校验报告的自动生成,以自动化手段全面支撑数据质量管理的事前防范事中检查以及事后评价。

附图说明

以下结合附图和实施例对本发明作进一步说明,其中:

图1为本发明的流程示意图。

具体实施方式

在此作为示范的优选实施例中,以电网营销系统为例说明整个流程。为了简化业务逻辑,该例子只选取“合同”对象做说明。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司;贵州电网公司信息通信分公司;广东卓维网络有限公司;贵州广思信息网络有限公司,未经中国南方电网有限责任公司;贵州电网公司信息通信分公司;广东卓维网络有限公司;贵州广思信息网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410013537.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top