[发明专利]一种大数据分层数据存储下的数据预热读取方法在审
申请号: | 202210953976.5 | 申请日: | 2022-08-09 |
公开(公告)号: | CN115495393A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 周晔;穆海洁;张坤;郭松 | 申请(专利权)人: | 上海汇付支付有限公司 |
主分类号: | G06F12/0862 | 分类号: | G06F12/0862;G06F9/54 |
代理公司: | 上海简克律师事务所 31417 | 代理人: | 刘君 |
地址: | 200233 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 分层 存储 预热 读取 方法 | ||
1.一种大数据分层数据存储下的数据预热读取方法,其特征在于,包含以下步骤:
对迁移同步工具CloudCanal的接口进行调用,创建关系型数据库RDS到消息队列服务Kafka的同步链路,并将所述关系型数据库RDS中的数据变更日志发送至消息队列服务Kafka;
通过调用流处理框架Flink,实时消费消息队列服务Kafka的数据并写入开源数据库Hbase中,所述开源数据库Hbase为分布式的列式存储方案;
业务系统发起数据读取,将业务系统数据读取按读取时间与当前时间进行比较,若在预设时间段内,则直接获取热数据层数据,若超出所述预设时间段,则执行数据预热获取步骤;
执行所述数据预热获取步骤,包括:发消息至缓存数据系统,并返回业务系统“处理中”的数据标志位,由数据缓存系统发送数据查询请求至开源数据库Hbase,通过开源数据库Hbase获取数据并写入本地缓存以完成数据预加热,发送异步通知至业务系统以触发业务系统重新发起数据读取,获取所需数据。
2.根据权利要求1所述的一种大数据分层数据存储下的数据预热读取方法,其特征在于,所述业务系统包括冷数据层、缓存数据系统以及热数据层;
所述热数据层中存储小于预设时间段的数据,用于被业务系统直接读取;
所述冷数据层用于存储超出预设时间段的数据;
所述缓存数据系统用于响应用户对超出所述预设时间段数据的读取需求,并存储预加热的所述数据。
3.根据权利要求2所述的一种大数据分层数据存储下的数据预热读取方法,其特征在于,一种大数据分层数据存储下的数据预热读取方法,其特征在于,还包括步骤:
将关系型数据库管理系统mysql的binlog日志传入消息队列服务Kafka,生成消息,再调用流处理框架Flink的接口,完成消费消息队列服务Kafka消息,并写入开源数据库Hbase的操作。
4.根据权利要求1所述的一种大数据分层数据存储下的数据预热读取方法,其特征在于,所述迁移同步工具CloudCanal通过消费源端数据源增量操作日志,实时在对端数据源重放,以达到数据同步目的,所述迁移同步工具CloudCanal支持多种数据源,具备断点续传、DDL同步、边同步边校验、对端事务保持、高性能对端写入、数据条件过滤能力。
5.根据权利要求1所述的一种大数据分层数据存储下的数据预热读取方法,其特征在于,所述消息队列服务Kafka为高吞吐量、高扩展性的分布式消息队列服务类型,用于处理动作流数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海汇付支付有限公司,未经上海汇付支付有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210953976.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种激光雷达安装装置
- 下一篇:一种物流货物运输固定装配装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置