[发明专利]一种自动化加载数据的方法和装置在审
申请号: | 201810149117.4 | 申请日: | 2018-02-13 |
公开(公告)号: | CN110209662A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 任文治;袁建军 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;涂艳 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 临时表 读取 方法和装置 分区数据 加载数据 预设 字段 标示 自动化 计算机技术领域 数据时效性 数据准确性 获取数据 目标表 数据源 写入 数据库 保证 | ||
本发明公开了自动化加载数据的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取数据源,以导入数据库中的临时表;读取所述临时表,如果存在预设时间内需要处理的分区数据,则读取所述分区数据对应数据源中预设的标示字段;根据所述标示字段,将所述临时表中的数据写入目标表中。该实施方式能够解决现有技术中加载数据时效性无法保证,数据准确性和安全性差的问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种自动化加载数据的方法和装置。
背景技术
目前,在流量数据解析中有很多业务数据无法从系统中直接拿到,需要手动处理后再人工添加到文件系统中。具体地,新的流量数据需要手动整理成hive(是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。)表格式的数据集,然后备份仓库中表数据,并且需要手动删除备份仓库中hdfs(Hadoop Distributed File System分布式文件系统)下的数据,且需要手动把最新数据put到hdfs路径下。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
在加载业务数据过程中由于采用的都是人工处理,所以很多时候无法保证时效性,也影响数据准确性和安全性。
发明内容
有鉴于此,本发明实施例提供一种自动化加载数据的方法和装置,可以解决现有技术中加载业务数据时效性无法保证,数据准确性和安全性差的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种自动化加载数据的方法,包括:获取数据源,以导入数据库中的临时表;读取所述临时表,如果存在预设时间内需要处理的分区数据,则读取所述分区数据对应数据源中预设的标示字段;根据所述标示字段,将所述临时表中的数据写入目标表中。
可选地,所述获取数据源,以导入数据库中的临时表,包括:读取外部数据源,对不同格式的数据源进行解析;将解析后的不同格式数据处理成数据库可读取的格式,以导入数据库中的临时表。
可选地,对执行相应操作的数据库中目标表进行校验,以判断数据加载是否正常。
可选地,所述读取所述分区数据对应数据源中预设的标示字段之前,还包括:缓存当前数据库的目标表文件大小;
所述对执行相应操作的数据库中目标表进行校验,包括:比对目标表执行相应操作前后的文件大小,如果执行相应操作后的目标表文件大小大于执行相应操作前的目标表文件大小则数据加载正常。
可选地,根据所述标示字段,将所述临时表中的数据写入目标表中,包括:如果所述标示字段为新增操作,则获取临时表中每条数据的主键,判断在目标表中是否有与临时表相同主键的数据;
如果没有与临时表相同主键的数据,则将临时表中的数据和目标表中数据进行合并,然后重写回目标表。
可选地,根据所述标示字段,将所述临时表中的数据写入目标表中,包括:如果所述标示字段为更新操作,则获取临时表中每条数据的主键,删除目标表中具有相同主键的数据;把临时表中的数据和目标表中数据进行合并,然后重写回目标表。
另外,根据本发明实施例的一个方面,提供了一种自动化加载数据的装置,包括导入模块,用于获取数据源,以导入数据库中的临时表;读取模块,用于读取所述临时表,如果存在预设时间内需要处理的分区数据,则读取所述分区数据对应数据源中预设的标示字段;执行模块,用于根据所述标示字段,将所述临时表中的数据写入目标表中。
可选地,所述导入模块获取数据源,以导入数据库中的临时表时,包括:读取外部数据源,对不同格式的数据源进行解析;将解析后的不同格式数据处理成数据库可读取的格式,以导入数据库中的临时表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810149117.4/2.html,转载请声明来源钻瓜专利网。