[发明专利]一种多数据源数据同步监控方法及系统有效

专利信息
申请号: 202210750912.5 申请日: 2022-06-29
公开(公告)号: CN114840393B 公开(公告)日: 2022-09-30
发明(设计)人: 陈思宏 申请(专利权)人: 杭州比智科技有限公司
主分类号: G06F11/30 分类号: G06F11/30;G06F11/32;G06F16/27;G06F16/25;G06F16/23;G06F9/50;G06F9/52
代理公司: 北京云科知识产权代理事务所(特殊普通合伙) 11483 代理人: 张飙
地址: 311121 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多数 数据 同步 监控 方法 系统
【权利要求书】:

1.一种多数据源数据同步监控方法,其特征在于,所述方法包括以下步骤:

S110,根据渠道分配生成对应同步任务;

S120根据任务设置的数据来源,确定与之对应的处理器;

S130,将任务交给数据处理器进行切片;在切片成功的情况下,进入步骤S140,在切片失败的情况下,进入步骤S160;

S140,数据读取、数据组装、数据异步批量写入和并发控制;在数据异步写入成功的情况下,进入步骤S150;在数据异步写入失败的情况下,进入步骤S160;

S150,检查各个切片同步数据,是否同步完成,当所有切片完成则同步任务完成,若是其中一个切片失败则整个任务失败,任务失败通知运维人员,任务恢复后通知相关人员;

S160,同步任务失败触发,恢复告知;

S170,同步监控平台日志,展示所有同步任务,查切片能具体看到每个切片情况,重试某个同步任务、某个切片、以及重置切片id段后重新同步;

步骤S130中,处理器按切片策略进行切片,切片包括两种策略方式,一种是等分切片,将数据按配置对切片数据进行切片,数据总量m条,每切片n条,m/n=k切片,若m%n!=0,证明不能整除,切片数m/n加一存放剩余的数量;另一种是固定切片,按配置切片数量进行均摊,数据总量m条,分n个切片,故每个切片k条,若m%n!=0,证明不能整除,再处理最后一个切片时需要同步剩余的所有数据;切片与数据的联系方式如下:在同步数据有唯一标识字段时,给每个切片分配一段id段进行标识并记录对应数据源的数据片段,标识这个切片的id段并映射对应的源数据,当重试、清理数据时可根据这个id段进行批量清除和重新同步,定位切片已同步数据段SQL,将重试降低到m/n数据上,其中,m是重试切片数,n是总体切片数;

任务切片到插入目标源完成数据同步的过程包含如下子步骤:

S210,判断是否走默认切片规则;

S211,不是默认规则根据配置选择切片规则;

S212,根据切片策略进行切片;

S213,获取并发锁,控制数据插入目标的速率;

S214,并发线程数据插入目标库中,提高同步速度。

2.根据权利要求1所述的多数据源数据同步监控方法,其特征在于,所述方法还包括步骤S180,检查步骤S120中的未完成任务是否超时,超时进行快速失败处理,并提示任务异常中断需要人为介入。

3.根据权利要求2所述的多数据源数据同步监控方法,其特征在于,步骤S140中,首先根据读取方式获取数据;然后根据处理器数据组装策略组装数据集合,最后数据集进行批量写入目标源;读取方式包括读取表的y行到x行使用JDBC的流式读取;控制并发执行线程,使用CountDownLatch计数器作为临时计数器,在结合线程池阻塞队列,在到达并发限制时进行阻塞等待。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州比智科技有限公司,未经杭州比智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210750912.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top