[发明专利]一种基于数据转换整合的实时数据处理方法在审
| 申请号: | 202111532519.0 | 申请日: | 2021-12-15 |
| 公开(公告)号: | CN114385728A | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 颜铮;曹健;张华云;李品;高振宇;黄伟 | 申请(专利权)人: | 江苏瑞中数据股份有限公司;南瑞集团有限公司 |
| 主分类号: | G06F16/25 | 分类号: | G06F16/25 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210012 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据 转换 整合 实时 数据处理 方法 | ||
本发明公开了一种基于数据转换整合的实时数据处理方法,包括以下步骤:首先确定熟悉所需对接消息中间件的软件特性,制定数据转换整合系统集成此中间件的方案;适配抽取插件和加载插件并且使插件适应流式实时传输处理数据;定制消息确认插件,增加容错能力。本发明为数据转换整合系统提供了一种可行有效的实时数据处理方法;本发明可适配市场上多种不同的消息中间件;本发明提供了消息确认机制,由于异常未被确认的消息可重新消费处理,使用此方法保证了数据的完整性、可靠性。
技术领域
本发明涉及信息技术,特别是一种基于数据转换整合的实时数据处理方法。
背景技术
近几十年来,随着科技的迅猛发展和信息化建设的推进,使得人类社会所积累的数据量大大增加,数据的采集、存储、处理和传播的数量也与日俱增,因此传统的数据转换整合系统应运而生,数据转换整合系统构建数据仓库的核心是建模,在数据仓库的构建中,数据转换整合系统贯穿于项目始终,它是整个数据仓库的生命线。从数据源中抽取数据,然后对这些数据进行转化,最终加载到目标数据库或者数据仓库中去,这也就是我们通常所说的ETL过程(Extract TransformLoad),通常数据抽取工作分抽取、清洗、转换、装载几个步骤,可见传统ETL系统主要应用于任务级别的对于数据的批处理操作。但是随着信息软件的技术发展,现代软件对于数据的实时性要求越来越高,而传统数据转换整合系统系统并没有针对此种应用场景提供很好的技术方案。
发明内容
发明目的:本发明的目的是提供一种基于数据转换整合的实时数据处理方法,从而解决传统数据转换整合系统对于实时数据处理能力不足的问题,使系统拥有类似于flink和blink的实时数据处理能力,增加和拓展传统数据转换整合系统的应用范围和可用性。
技术方案:本发明所述的一种基于数据转换整合的实时数据处理方法,包括以下步骤:
(1)确定熟悉所需对接消息中间件的软件特性和SDK文档,制定数据转换整合系统集成此中间件的方案;
(2)根据(1)适配消息消费插件,插件按行消费消息中间件中的缓存数据,且给每条数据标记产生一个唯一MessageId后把数据传递给后续插件;插件能够设置消费最大时间或消费最大行数,当插件所在任务运行时,处理数据时间达到最大时长设置值或处理数据行数达到消费最大行数设置值,任务自动停止;
(3)根据(1)适配消息生产插件,插件能够从前序插件中获取数据并提交到消息中间件中;能够设置提交的最大等待时间和最大等待行数,当插件所在任务运行时,此插件缓存数据每达到设置的最大等待时间或最大等待行数,则提交一次数据入息中间件;能够根据实时性要求,灵活调整参数,实时性要求越高的场景,最大等待时间和最大等待行数越低;
(4)根据(1)适配消息确认插件,(2)中每条消息会产生一个MessageId;本插件从(3)中消息生产插件获取MessageId后通知(2)中消息消费插件,消息消费插件拿到通知后则提交当前数据点位,被提交点位的数据视为业务正常完成的数据,当出现异常时该数据不会再次被(2)消息消费插件消费;
(5)数据转换整合系统管理页面对任务进行设置执行规则,当任务不在运行时则立即启动该任务,使任务在异常退出或(2)设置的条件达到退出时,自动重新启动继续消费处理数据;
(6)根据实际应用情况进行迭代优化,并监控此种特殊类型的任务的运行情况。
步骤(1)所述的对接消息中间件包括ActiveMQ、kafka、Datahub、RocketMq。
步骤(1)所述的中间件的方案内容包含跟据中间件SDK和数据转换整合系统插件适配原理,在数据转换整合系统中适配能够从中间件消费数据的插件、生产数据的插件、消息确认的插件。
一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的一种基于数据转换整合的实时数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏瑞中数据股份有限公司;南瑞集团有限公司,未经江苏瑞中数据股份有限公司;南瑞集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111532519.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





