[发明专利]用于实时数据ETL系统的记忆式调度方法有效

专利信息
申请号: 200910028104.2 申请日: 2009-01-09
公开(公告)号: CN101551811A 公开(公告)日: 2009-10-07
发明(设计)人: 常维;余志刚;刘国祥;卞国震;张峰;刘树权;沈鹏程;兰清 申请(专利权)人: 南京联创科技股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京天翼专利代理有限责任公司 代理人: 汤志武;王鹏翔
地址: 210013江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 实时 数据 etl 系统 记忆 调度 方法
【权利要求书】:

1.用于实时数据ETL系统的记忆式调度方法,其特征是:ETL调度主程序按照预先设定的顺序执行某个任务、ETL即数据抽取、转换和加载,执行的时候把lscycle最近成功数据周期、curcycle当前处理数据周期和endcycle处理截止数据周期由调度引擎记忆下来的关键信息传给被调程序,被调程序执行完成之后,由调度引擎记录并保存更新后的调度信息;在数据重抽中,通过记忆式调度方法自动对其中的某些任务和某些周期进行自动重抽;

ETL数据分类:

根据ETL数据的变化特点,分成固定周期数据和周期闭环数据:

固定周期:是指在分析周期内数据是静止的数据;

周期闭环:指抽取特定周期内数据是变化的、取最后一次变化的记录;该周期是不固定的,其时间范围为上次执行抽取的时间到本次执行抽取发生的时间;

记忆式调度方法:

假定调度流程Wf1,任务B1∈Wf1,则

Wf1的状态={wstate状态、

          lscycle最近成功数据周期、

          endcycle处理截止数据周期、

          curcycle当前处理数据周期}

B1的状态={bstate状态、

          succnum成功运行次数、

          succtotal成功运行总历时、

          succavg成功运行平均历时}

周期闭环的记忆式调度方法:

某个周期闭环数据集A,A的起始抽取时间是Φ,每隔T0分钟抽取一次,则数据集A的抽取时间集=[Φ,Φ1)+[Φ1,Φ2)+[Φ2,Φ3)+…+[Φn-1,Φn)+…

其中,“[Φn”表示≥Φn,“Φn+1)”表示<Φn+1

Φn表示每隔T0分钟去抽取数据集A的当时的时间点,等于Φ+T0*n,n从1开始,表示从Φ开始之后的第n个T0分钟;

因此,对于周期闭环当中的某个[Φn,Φn+1):

lscycle=[Φn-2,Φn-1)

curcycle=[Φn-1,Φn)

endcycle=[Φn-1,Φn)

这几个关键性的信息被调度引擎记忆下来,从而不需要被调程序进行处理,由调度引擎自动告诉被调程序执行以下时间序列的任务:

[Φn-1,Φn)

同时,wstate、bstate、succnum、succtotal和succavg也被调度引擎记忆下来;

固定周期的记忆式调度

对于固定周期的数据ETL调度,假定数据集B,B的起始抽取周期是∏,每隔T1天抽取一次,则数据集B的抽取周期集=∏1+∏2+∏3+…+∏n-1+∏n+…

其中,∏n等于∏+n,n从1开始,表示从∏开始之后的第n天;因此,对于固定周期当中的某个∏n:

lscycle=∏n-1

curcycle=∏n

endcycle=∏k

这几个关键性的信息被调度引擎记忆下来,从而不需要被调程序进行处理,由调度引擎自动告诉被调程序执行以下时间序列的任务:

∏n、∏n+1...∏k-1、∏k

同时,wstate、bstate、succnum、succtotal和succavg也被调度引擎记忆下来,k≥n;

在ETL任务由于某种原因被暂停或执行失败而在时间上滞后预定计划,在该任务重新恢复正常运行时,能进行ETL任务的自动追赶。

2.根据权利要求1所述的用于实时数据ETL系统的记忆式调度方法,其特征是在周期闭环的抽取模式中,根据时间戳进行实时的数据ETL。

3.根据权利要求1所述的用于实时数据ETL系统的记忆式调度方法,其特征是每个任务都可以对自身的运行情况进行自我评估。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京联创科技股份有限公司,未经南京联创科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910028104.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top