[发明专利]日志数据备份方法、装置、设备及存储介质在审
申请号: | 202110348113.0 | 申请日: | 2021-03-31 |
公开(公告)号: | CN112905390A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 马骋原;张良友;张绍震 | 申请(专利权)人: | 恒生电子股份有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F16/18;G06F16/172 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 曹瑞敏 |
地址: | 310053 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 日志 数据 备份 方法 装置 设备 存储 介质 | ||
本申请提供了一种日志数据备份方法、装置、设备及存储介质,日志数据备份方法包括:从第一集群中每个区域服务的预写日志文件中采集每个区域服务对应的多条日志记录,每个区域服务预先分配有至少一个预分配存储区域,从至少一个预分配存储区域中分别确定每条日志记录对应的目标存储区域,采用目标存储区域对应的目标解析线程,对每条日志记录进行解析处理,得到每条日志记录中的日志数据,对多条日志记录中的日志数据进行备份。采用目标解析线程对日志记录进行解析处理,实现了多线程分片并行处理日志记录,各目标存储区域之间不会互相干扰,使各目标存储区域在串行解析的同时也能保证高吞吐量,并且无需对HBase集群的配置进行额外调整。
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种日志数据备份方法、装置、设备及存储介质。
背景技术
HBase(Hadoop Database)是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在个人电脑服务器上搭建起大规模结构化存储集群。
相关技术中,HBase的预写日志(Write Ahead Log,WAL)机制提供了一种高并发、持久化的日志保存与回放的功能,每次执行业务数据的写入操作时,都会将该数据对应的日志记录在日志文件中,因此,基于HBase的复制(Replication)功能,通过日志文件的获取和回放能够实现HBase集群间的业务数据的同步。
然而,在对日志文件进行备份过程中,需要对HBase集群配置做一定的调整,并且基于Replication功能无法对压缩的日志文件进行解析。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种日志数据备份方法、装置、设备及存储介质,以实现多线程分片并行处理日志记录,各目标存储区域之间不会互相干扰,使各目标存储区域在串行解析的同时也能保证高吞吐量,并且无需对HBase集群的配置进行额外调整。
第一方面,本申请一实施例提供了一种问答模型训练方法,方法包括:
从第一集群中每个区域服务的预写日志文件中采集每个区域服务对应的多条日志记录,其中,每个区域服务预先分配有至少一个预分配存储区域,第一集群为HBase集群;
从至少一个预分配存储区域中分别确定每条日志记录对应的目标存储区域;
采用目标存储区域对应的目标解析线程,对每条日志记录进行解析处理,得到每条日志记录中的日志数据;
对多条日志记录中的日志数据进行备份。
可选地,采用目标存储区域对应的目标解析线程,对每条日志记录进行解析处理,得到每条日志记录中的日志数据,包括:
采用目标解析线程,将每条日志记录反序列化为单位对象;
根据预设的开始字符和读取长度,从单位对象中读取字节数组;
将读取到的字节数组写入预设的数据对象,得到每条日志记录中的日志数据。
可选地,根据预设的开始字符和读取长度,从单位对象中读取字节数组,包括:
根据每个属性特征对应的开始字符和读取长度,从单位对象中读取每个属性特征;字节数组包括:读取到的至少一个属性特征。
可选地,每个区域服务还具有迁移存储区域,迁移存储区域为从其他区域服务迁移的存储区域;
采用目标存储区域对应的目标解析线程,对每条日志记录进行解析处理,得到每条日志记录中的日志数据,包括:
若待解析日志记录对应的目标存储区域为迁移存储区域,获取其他区域服务中最新解析的日志记录的第一序列标识,与待解析日志记录的第二序列标识的偏差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒生电子股份有限公司,未经恒生电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110348113.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置