[发明专利]一种自动化加载数据的方法和装置在审
申请号: | 201810149117.4 | 申请日: | 2018-02-13 |
公开(公告)号: | CN110209662A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 任文治;袁建军 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;涂艳 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 临时表 读取 方法和装置 分区数据 加载数据 预设 字段 标示 自动化 计算机技术领域 数据时效性 数据准确性 获取数据 目标表 数据源 写入 数据库 保证 | ||
1.一种自动化加载数据的方法,其特征在于,包括:
获取数据源,以导入数据库中的临时表;
读取所述临时表,如果存在预设时间内需要处理的分区数据,则读取所述分区数据对应数据源中预设的标示字段;
根据所述标示字段,将所述临时表中的数据写入目标表中。
2.根据权利要求1所述的方法,其特征在于,所述获取数据源,以导入数据库中的临时表,包括:
读取外部数据源,对不同格式的数据源进行解析;
将解析后的不同格式数据处理成数据库可读取的格式,以导入数据库中的临时表。
3.根据权利要求1所述的方法,其特征在于,还包括:
对执行相应操作的数据库中目标表进行校验,以判断数据加载是否正常。
4.根据权利要求3所述的方法,其特征在于,所述读取所述分区数据对应数据源中预设的标示字段之前,还包括:
缓存当前数据库的目标表文件大小;
所述对执行相应操作的数据库中目标表进行校验,包括:
比对目标表执行相应操作前后的文件大小,如果执行相应操作后的目标表文件大小大于执行相应操作前的目标表文件大小则数据加载正常。
5.根据权利要求1所述的方法,其特征在于,根据所述标示字段,将所述临时表中的数据写入目标表中,包括:
如果所述标示字段为新增操作,则获取临时表中每条数据的主键,判断在目标表中是否有与临时表相同主键的数据;
如果没有与临时表相同主键的数据,则将临时表中的数据和目标表中数据进行合并,然后重写回目标表。
6.根据权利要求1所述的方法,其特征在于,根据所述标示字段,将所述临时表中的数据写入目标表中,包括:
如果所述标示字段为更新操作,则获取临时表中每条数据的主键,删除目标表中具有相同主键的数据;
把临时表中的数据和目标表中数据进行合并,然后重写回目标表。
7.一种自动化加载数据的装置,其特征在于,包括:
导入模块,用于获取数据源,以导入数据库中的临时表;
读取模块,用于读取所述临时表,如果存在预设时间内需要处理的分区数据,则读取所述分区数据对应数据源中预设的标示字段;
执行模块,用于根据所述标示字段,将所述临时表中的数据写入目标表中。
8.根据权利要求7所述的装置,其特征在于,所述导入模块获取数据源,以导入数据库中的临时表时,包括:
读取外部数据源,对不同格式的数据源进行解析;
将解析后的不同格式数据处理成数据库可读取的格式,以导入数据库中的临时表。
9.根据权利要求7所述的装置,其特征在于,所述执行模块,还用于:
对执行相应操作的数据库中目标表进行校验,以判断数据加载是否正常。
10.根据权利要求9所述的装置,其特征在于,所述读取模块读取所述分区数据对应数据源中预设的标示字段之前,还包括:
缓存当前数据库的目标表文件大小;
所述执行模块对执行相应操作的数据库中目标表进行校验,包括:
比对目标表执行相应操作前后的文件大小,如果执行相应操作后的目标表文件大小大于执行相应操作前的目标表文件大小则数据加载正常。
11.根据权利要求7所述的装置,其特征在于,所述执行模块根据所述标示字段,将所述临时表中的数据写入目标表中,包括:
如果所述标示字段为新增操作,则获取临时表中每条数据的主键,判断在目标表中是否有与临时表相同主键的数据;
如果没有与临时表相同主键的数据,则将临时表中的数据和目标表中数据进行合并,然后重写回目标表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810149117.4/1.html,转载请声明来源钻瓜专利网。