[发明专利]一种数据实时同步方法在审
| 申请号: | 202110245191.8 | 申请日: | 2021-03-05 |
| 公开(公告)号: | CN112905594A | 公开(公告)日: | 2021-06-04 |
| 发明(设计)人: | 刘跃红;周小润 | 申请(专利权)人: | 银盛支付服务股份有限公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2453;G06F16/27 |
| 代理公司: | 深圳市深可信专利代理有限公司 44599 | 代理人: | 詹棋 |
| 地址: | 518000 广东省深圳市龙华*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 实时 同步 方法 | ||
本发明公开了一种数据实时同步方法,涉及大数据分析技术领域,该方法包括在业务系统做预处理过程,获取数据信息并最终存入C l i ckhouse节点中,预处理过程包括应用程序拉取数据,获取外部配置参数,同步mongodb集群条件、分页信息以及主键,该方法还包括应用程序依据mongodb集群条件查询拉取的数据,再根据分页信息去mongodb集群查询数据,拉取到最后一条数据时更新查询条件,更新后的数据作为下一个查询的条件,应用程序根据主键的排序,将查询获取的数据写入多个C l i ckhouse‑bu l ck proxy中,最终由C l i ckhouse‑bu l ck proxy将应用程序查询获取的数据写入C l i ckhouse节点中,本发明可以自行定义写入时间,实时性可调控,而且在分页查询下,可以避免数据拥堵查询不出的情况发生。
技术领域
本发明涉及大数据分析技术领域,具体来说,涉及一种数据实时同步方法。
背景技术
随着物联网IOT时代的来临,IOT设备感知和报警存储的数据越来越多,这些需要数据分析师去分析以提取有价值的信息。大数据分析成了非常重要的环节。近两年开启的开源大潮,为大数据分析工程师提供了十分富余的工具。但这同时也增加了开发者选择合适的工具的难度,尤其对于新入行的开发者来说,学习成本,框架的多样化和复杂度成了很大的难题。例如将kafka,hdfs,spark,hive等等组合起来才能产生最后的分析结果。但是,把各种开源框架、工具、库、平台人工整合到一起工作非常复杂。
Clickhouse的出现使得平台简单化和统一化变为现实,Clickhouse是Yandex.Metrica世界第二大Web分析平台而开发的。它是一款用于大数据实时分析的列式数据库管理系统,而非数据库。通过向量化执行以及对CPU底层指令集(SIMD)的使用,它可以对海量数据进行并行处理,从而加快数据的处理速度。很多商业机构纷纷转向Clickhouse,其中有不少是由mongodb转移到Clickhouse。但是,目前而言mongodb转移到Clickhouse并没有很好的同步工具或者方案,传统的都是通过脚本导出json文件然后再导入Clickhouse有很多缺点:
1、效率底下,数据质量得不到保障,耗时长;
2、clichouse不支持高并发,多个脚本同时运行导入可能会导致写入失败。
发明内容
为了克服现有技术的不足,本发明的一种数据实时同步方法,能够自行定义写入时间,实时性可调控,可以避免数据拥堵查询不出的情况发生。
本发明解决其技术问题所采用的技术方案是:一种数据实时同步方法,其改进之处在于,该方法包括在业务系统做预处理过程,获取数据信息并最终存入Clickhouse节点中,预处理过程包括下列步骤:
步骤1,应用程序拉取数据,获取外部配置参数,同步mongodb集群条件、分页信息以及主键;
步骤2,应用程序依据mongodb集群条件查询拉取的数据,再根据分页信息去mongodb集群查询数据,拉取到最后一条数据时更新查询条件,更新后的数据作为下一个查询的条件;
步骤3,根据主键的排序,应用程序将查询获取的数据写入多个Clickhouse-bulckproxy中;
步骤4,Clickhouse-bulck proxy将应用程序查询获取的数据写入Clickhouse节点中。
作为上述技术方案的改进,步骤1中,应用程序依据程序设置定时拉取数据。
作为上述技术方案的进一步改进,步骤2中,根据查询条件,应用程序会初始化mongodb客户端和mongodb集群的交互信息,获取mongodb集群返回的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银盛支付服务股份有限公司,未经银盛支付服务股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110245191.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型侧接式变压器油枕
- 下一篇:基于人工智能的多功能会计专用桌
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





