[发明专利]数据增量抽取转换与分发系统及方法有效
申请号: | 201510512018.4 | 申请日: | 2015-08-18 |
公开(公告)号: | CN105069142B | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 徐铭;孔兰菊;肖宗水;王振坤 | 申请(专利权)人: | 山大地纬软件股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 赵妍 |
地址: | 250101 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 增量 抽取 转换 分发 系统 方法 | ||
1.数据增量抽取转换与分发系统,其特征是,包括:
抽取转换设计器,首先对源数据库的数据源进行定义,设计转换规则然后定义数据目标,将设计完成的转换规则包装成KTR文件,通过节点连接形成的流,将数据信息或字段在模块之间进行传送;
抽取转换执行器,实时捕获源数据库的增量数据,并且分析增量数据的来源,将增量数据交给服务器,服务器分析得到的信息并选择调用对应的转换规则进行转换处理;批量的执行KTR文件;
抽取转换监控单元,能够监测规则的运行情况和控制数据同步的开始和停止,监测每一条转换规则当前是否正在进行数据同步,最近一次同步的数据量;另外,能够控制服务器的运行或停止,从而达到控制数据同步的运行或停止的效果;
抽取转换监控单元提供了监控日志的功能,对具体的转换过程进行监控,写入日志,解析监控日志,将具体的信息反馈给用户;抽取转换设计器提供了写入日志管理组件,在转换设计过程中加入日志管理组件,在抽取转换执行时监测所需的信息;
所述抽取转换设计器提供了图形化的编辑界面,能够以图形化的方式定义源数据库和目标数据库,并设计转换规则;包括:
定义数据源模块,对数据源进行定义,定义源数据库或中间库的连接信息;
转换规则设计模块,能够重命名字段,将源数据表中需要的字段重新命名后映射到目标表中;筛选字段,包括选择字段和删除字段;改变数据类型;改变字段精度;拆分字段;新增字段,在源数据表的基础上增加新的字段;字符串替换;
定义数据目标模块,编辑数据目标的连接信息,定义需要转换的字段,选择数据库的类型。
2.如权利要求1所述数据增量抽取转换与分发系统,其特征是,所述抽取转换执行器,利用Oracle stream技术捕获增量数据并调用Kettle API执行设计好的KTR文件来实现对源数据库增量数据的实时抽取和清洗转换,并实时地装载到目标数据库中。
3.如权利要求1所述数据增量抽取转换与分发系统,其特征是,所述抽取转换执行器包括:
捕获增量数据模块,实时捕获源数据库的增量数据,并且分析增量数据的来源;给应用进程配置一个处理函数;捕获进程会挖掘对源数据库产生变化的归档日志,捕获到增量数据,并且将增量数据暂存到消息队列中;
TCP消息发送模块,在捕获增量数据模块给应用进程配置的处理函数中识别增量数据的操作类型,所述操作类型包括插入、更新或删除,根据操作类型的不同调用不同的存储过程,并且在处理函数中使用TCP协议将增量数据以字符串的形式发送给服务器;
数据暂存模块,利用一个能释放的TXT文件作为临时存储空间,存储发送过来的TCP消息,并作为KTR的表输入段在抽取转换执行器中执行;当增量数据发送到服务器后会以二维表的结构暂时存储到TXT文件中;对处理过的TXT文件,系统会将其删除,节约存储空间;
执行转换模块,执行设计好的转换规则;在需要执行这些转换的时候,通过调用对应的API来执行这些转换,批量的执行KTR文件,并将转换后的数据装载到目标数据库中。
4.如权利要求1所述数据增量抽取转换与分发系统,其特征是,所述抽取转换监控单元包括:
日志解析模块,监控日志记录了抽取转换设计器设计转换规则的过程和抽取转换执行器的执行状态,日志解析模块解析监控日志,将具体的信息反馈给用户;
监控信息反馈模块,监测规则的运行情况和控制数据同步的开始和停止,将监控日志中的监控信息展现给用户。
5.如权利要求4所述数据增量抽取转换与分发系统,其特征是,所述监控日志用XML语言规范地记录了抽取转换设计器设计转换规则的过程和抽取转换执行器的执行状态;并且用XML解析器解析监控日志。
6.如权利要求4所述数据增量抽取转换与分发系统,其特征是,所述监控信息反馈模块能够将监控日志中的信息以Web的形式展现给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山大地纬软件股份有限公司,未经山大地纬软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510512018.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:兴趣标签生成方法
- 下一篇:一种基于读者层次的内容推送方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置