[发明专利]实时数据仓库的数据校验方法、系统及计算机可读介质在审
申请号: | 202110483615.4 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113076310A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 杨涛;王宇 | 申请(专利权)人: | 浙江太美医疗科技股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/21 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 杜娟;骆希聪 |
地址: | 314000 浙江省嘉兴市经济技*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实时 数据仓库 数据 校验 方法 系统 计算机 可读 介质 | ||
1.一种实时数据仓库的数据校验方法,所述实时数据仓库与业务数据库进行实时数据同步,其特征在于,所述方法包括:
记录一校验时刻;
从所述业务数据库中获取所述校验时刻之前的业务数据;
等待一预设时长之后,从所述实时数据仓库中获取同步数据,所述同步数据对应于所述业务数据;
对比所述业务数据和所述同步数据,获得所述业务数据和所述同步数据之间的差异数据集合;以及
根据所述差异数据集合获得所述实时数据仓库的校验结果。
2.如权利要求1所述的数据校验方法,其特征在于,所述记录一校验时刻的步骤包括:
采用大数据计算框架启动一批处理作业,所述批处理作业适于从所述业务数据库中获取所述业务数据,以及从所述实时数据仓库中获取所述同步数据;以及
记录所述批处理作业的启动时间,将所述启动时间作为所述校验时刻。
3.如权利要求2所述的数据校验方法,其特征在于,所述大数据计算框架包括ApacheSpark框架。
4.如权利要求2所述的数据校验方法,其特征在于,所述对比所述业务数据和所述同步数据的步骤包括:
按照唯一主键将所述业务数据和所述同步数据对应起来,形成合并数据表,其中,具有相同唯一主键的所述业务数据和所述同步数据位于所述合并数据表中的同一行;以及
在所述合并数据表中逐行对比所述业务数据和所述同步数据,获得所述业务数据和所述同步数据不一致的差异数据。
5.如权利要求4所述的数据校验方法,其特征在于,所述差异数据集合包括以下三种错误:第一错误,所述业务数据包括所述唯一主键对应的第一数据,所述同步数据包括所述唯一主键对应的第二数据,所述第一数据和所述第二数据对应于相同的字段,所述第一数据不同于所述第二数据;第二错误,所述业务数据中包括所述第一数据,所述同步数据中不包括所述第二数据;以及第三错误,所述业务数据中不包括所述第一数据,所述同步数据中包括所述第二数据。
6.如权利要求5所述的数据校验方法,其特征在于,所述实时数据仓库包括删除标记字段,所述删除标记字段用于标记所述同步数据是否经过软删除操作,所述软删除操作不实际删除所述同步数据。
7.如权利要求6所述的数据校验方法,其特征在于,在所述第二错误下,根据所述差异数据集合获得所述实时数据仓库的校验结果的步骤包括:查找所述删除标记字段,若所述删除标记字段中不包括对应于所述第二数据的记录,则所述校验结果为所述实时数据仓库具有错误。
8.如权利要求1所述的数据校验方法,其特征在于,所述业务数据库中包括数据变更日志,所述数据变更日志中包括所述业务数据中的任意数据发生变更的变更时间,根据所述差异数据集合获得所述实时数据仓库的校验结果的步骤包括:比较所述变更时间和所述校验时刻,若所述变更时间早于所述校验时刻,则所述校验结果为所述实时数据仓库具有错误。
9.如权利要求8所述的数据校验方法,其特征在于,所述数据变更日志是二进制日志binlog。
10.如权利要求1所述的数据校验方法,其特征在于,所述实时数据仓库包括kudu数据库,所述业务数据库包括MySQL数据库。
11.如权利要求1所述的数据校验方法,其特征在于,由采集系统执行所述实时数据仓库与所述业务数据库的实时数据同步,所述采集系统具有系统延迟,所述预设时长等于所述系统延迟。
12.如权利要求1所述的数据校验方法,其特征在于,还包括:当所述校验结果为所述实时数据仓库具有错误时,修复所述错误。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江太美医疗科技股份有限公司,未经浙江太美医疗科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110483615.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置