[发明专利]数据质量校验方法、装置、存储介质及电子设备在审
申请号: | 201810475673.0 | 申请日: | 2018-05-17 |
公开(公告)号: | CN108647358A | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 李春毅 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹;南毅宁 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校验规则 数据表结构 属性信息 存储介质 电子设备 校验数据 质量校验 字段添加 校验规则库 数据校验 校验 自适应 预设 字段 | ||
1.一种数据质量校验方法,其特征在于,包括:
确定待校验数据的数据表结构包括的各个字段的属性信息;
根据所述属性信息及预设校验规则库中的属性信息与校验规则之间的对应关系,分别为所述数据表结构包括的每个字段添加校验规则;
根据添加的校验规则,对所述待校验数据进行校验。
2.根据权利要求1所述的方法,其特征在于,在根据添加的校验规则,对所述待校验数据进行校验之前,还包括:
取所述待校验数据中预设数量的数据,按照所述添加的校验规则进行预校验;
根据所述预校验的结果,对所述添加的校验规则进行调整;
根据添加的校验规则,对所述待校验数据进行校验,包括:
根据调整后的校验规则,对所述待校验数据进行校验。
3.根据权利要求2所述的方法,其特征在于,根据所述预校验的结果,对所述添加的校验规则进行调整,包括:
保留校验通过率达到预设比例的校验规则;
删除校验通过率未达到所述预设比例的校验规则。
4.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:
获取对所述数据表结构包括的字段增加校验规则的操作;
将增加的校验规则与对应字段的属性信息之间的对应关系添加到预备规则库中,并令该对应关系使用次数的计数加一;
其中,针对所述预备规则库中的对应关系,将使用次数达到预设次数的对应关系添加到所述预设校验规则库中。
5.根据权利要求1-3任一所述的方法,其特征在于,所述属性信息包括字段名称和字段类型中的至少一者。
6.一种数据质量校验装置,其特征在于,包括:
确定模块,用于确定待校验数据的数据表结构包括的各个字段的属性信息;
规则添加模块,用于根据所述属性信息及预设校验规则库中的属性信息与校验规则之间的对应关系,分别为所述数据表结构包括的每个字段添加校验规则;
校验模块,用于根据添加的校验规则,对所述待校验数据进行校验。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
预校验模块,用于在所述校验模块根据添加的校验规则,对所述待校验数据进行校验之前,取所述待校验数据中预设数量的数据,按照所述添加的校验规则进行预校验;
规则调整模块,用于根据所述预校验的结果,对所述添加的校验规则进行调整;
所述校验模块用于:
根据所述规则调整模块调整后的校验规则,对所述待校验数据进行校验。
8.根据权利要求7所述的装置,其特征在于,所述规则调整模块用于:
保留校验通过率达到预设比例的校验规则;
删除校验通过率未达到所述预设比例的校验规则。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
权利要求9中所述的计算机可读存储介质;以及
一个或者多个处理器,用于执行所述计算机可读存储介质中的程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810475673.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据查询的方法及装置
- 下一篇:信息推送方法、装置、计算机设备及存储介质