[发明专利]数据处理方法、装置、电子设备、存储介质及程序产品在审
申请号: | 202111064294.0 | 申请日: | 2021-09-10 |
公开(公告)号: | CN113742410A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 关振宇;朱家强;郑为锋 | 申请(专利权)人: | 拉卡拉支付股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/182;G06F16/28 |
代理公司: | 北京智宇正信知识产权代理事务所(普通合伙) 11876 | 代理人: | 李明卓 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 程序 产品 | ||
本公开实施例公开了一种数据处理方法、装置、电子设备、存储介质及程序产品,所述方法包括:检测目标文件是否被操作;当检测到所述目标文件被操作时,获取目标文件操作时间;将所述目标文件操作时间发送给数据仓库组件,以使所述数据仓库组件对于所述目标文件操作时间进行存储。该技术方案无需增加一个时间字段来标记数据文件的加工时间,从而降低了操作复杂度、人工工作量和数据存储量,避免了时间字段的显式编程加工,进而减小了数据仓库的存储压力。
技术领域
本公开实施例涉及数据处理技术领域,具体涉及一种数据处理方法、装置、电子设备、存储介质及程序产品。
背景技术
hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转化和加载等操作,以实现对于存储在Hadoop中的大规模数据的查询和分析。在利用hive进行数据提取、转化和加载等操作时,通常需要增加一个时间字段来标记数据文件的加工时间,但时间字段的设置增加了操作复杂度、人工工作量和数据存储量。
发明内容
本公开实施例提供一种数据处理方法、装置、电子设备、存储介质及程序产品。
第一方面,本公开实施例中提供了一种数据处理方法。
具体的,所述数据处理方法,包括:
检测目标文件是否被操作;
当检测到所述目标文件被操作时,获取目标文件操作时间;
将所述目标文件操作时间发送给数据仓库组件,以使所述数据仓库组件对于所述目标文件操作时间进行存储。
第二方面,本公开实施例中提供了一种数据处理方法。
具体的,所述数据处理方法,包括:
接收文件系统发送的目标文件操作时间;
确定预设数据写入格式;
将所述目标文件操作时间按照所述预设数据写入格式写入至文件时间虚拟列中。
结合第二方面,本公开实施例在第二方面的第一种实现方式中,还包括:
设置文件时间虚拟列。
结合第二方面和第二方面的第一种实现方式,本公开实施例在第二方面的第二种实现方式中,还包括:
设置所述文件时间虚拟列的开启参数,其中,所述开启参数包括开启和不开启。
结合第二方面、第二方面的第一种实现方式和第二方面的第二种实现方式,本公开在第二方面的第三种实现方式中,还包括:
响应于接收到文件时间虚拟列数据读写命令,确定所述文件时间虚拟列的开启参数是开启还是不开启;
当所述文件时间虚拟列的开启参数是开启时,根据所述文件时间虚拟列数据读写命令对于所述文件时间虚拟列进行数据读写;
当所述文件时间虚拟列的开启参数是不开启时,返回文件时间虚拟列数据不可用提示信息。
第三方面,本公开实施例中提供了一种数据处理方法。
具体的,所述数据处理方法,包括:
文件系统检测目标文件是否被操作,当检测到所述目标文件被操作时,获取目标文件操作时间,并将所述目标文件操作时间发送给数据仓库组件;
数据仓库组件接收文件系统发送的目标文件操作时间,确定预设数据写入格式,并将所述目标文件操作时间按照所述预设数据写入格式写入至文件时间虚拟列中。
结合第三方面,本公开实施例在第三方面的第一种实现方式中,还包括:
数据仓库组件设置文件时间虚拟列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于拉卡拉支付股份有限公司,未经拉卡拉支付股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111064294.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种陶泥等质量分割设备
- 下一篇:一种联动线的灌装结构及灌装搅拌方法