[发明专利]实现用于集成系统的统一模型的系统和方法无效
申请号: | 200710192727.4 | 申请日: | 2007-11-16 |
公开(公告)号: | CN101192239A | 公开(公告)日: | 2008-06-04 |
发明(设计)人: | A·巴尔-奥尔;M·J·贝克勒 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 朱海波 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 用于 集成 系统 统一 模型 方法 | ||
技术领域
本发明涉及一种实现用于集成系统的统一模型的系统和方法。更为特别地,本发明涉及一种系统和方法,其用于使用统一模型以在数据流程图中表达应用而不设人工边界,其反过来允许更大的应用优化。
背景技术
集成世界中的应用通常按诸如批量、事务和连续之类的类别进行区分。批量处理集成应用(IA)主要使用在新的集成解决方案替代旧定制的完全不同的应用并且需要移动现有数据的情况下。事务IA主要以商业过程管理(BPM)的形式出现,其中各种应用在事务保证下通过互换请求和彼此应答来实现商业过程。而连续IA是判决支持领域中的新兴应用。综合事件处理(CEP)、事件驱动架构(EDA)、实时数据挖掘和知识提取、商业活动监视(BAM)都是连续应用的例子,其连续地处理来自完全不同的应用的按时间排序的数据以提供对在机构中流动的数据更好的理解。
在企业集成世界中的主流技术是ETL(提取、变换、装载)、EAI(企业应用集成)和EII(企业信息集成)。这些技术中的每种技术相比其他技术都具有优点和缺点,并且因此这些技术的任何一种都没有获得压倒性的胜利。虽然这些技术具有不同的能力,但是它们仍然共享许多概念和组件,并且在许多时候可以使用一种技术来替代另一种。
SQL(选择查询语言)模型是在关系数据库所基于的EII系统背后的模型。用SQL表达的这种模型被变换成数据流有向树图。该图的顶点是集合算子,并且数据集合在各算子间流动,只要它们是可用的。在ETL系统背后的模型也是类似于SQL模型的数据流模型,虽然该模型可以表达任何有向非循环图而不仅仅是树图。在EAI系统背后的模型是工作流模型。该模型可以用BPEL来表达并且表示有向非循环图,在该图中顶点是一旦进入数据就执行的活动。
所发现的挑战是,现有技术具有人工区分,其产生相当多的冗余。另外,现有技术不提供针对连续应用的解决方案。所发现的另一个挑战是,现有模型中的每种模型相比其他模型具有缺点,并且因此对于解决方案架构而言,选择设计应用将使用的系统和模型可能并不总是清楚的。另外,因为现有模型的缺点,许多解决方案不能使用现有模型来实现。作为结果,解决方案架构可能需要定制解决方案,其开发和维护起来都很昂贵。此外,定制解决方案通常质量较低,因为打包软件经历更苛刻的测试。
因此,需要一种系统和方法,其使用包含现有系统模型的优点的统一模型来表达应用。
发明内容
已经发现,通过使用一种用于在数据流计算系统中使用数据流程图来模拟数据流的系统、方法和计算机程序产品解决了上述挑战。该数据流程图包括多个算子,每个算子包括至少一个输入端口或至少一个输出端口。该数据流程图还包括多个弧,每个弧将算子的输出端口之一连接到不同算子的输入端口。在该数据流程图中,多个数据项沿着各算子之间的弧以流进行流动。第一算子将多个数据项归类成粒子并对该粒子归类执行计算,其得到已计算的多个数据项。该第一算子在多个弧之一上将已计算的多个数据项传送给第二算子。另外,该第一算子基于元状态转移在它的元端口之一上产生控制数据项,所述元状态转移响应于对在粒子归类执行的计算。最终,该第一算子将控制数据项传送给另一算子,其反过来基于控制数据项来控制已计算的多个数据项的流动。
在一个实施例中,该系统、方法和计算机程序产品使用控制数据项来通过使用门算子控制已计算的多个数据项的流动。在这个实施例中,门算子阻止已计算的多个数据项到达不同的算子,直到控制数据项指示门算子将已计算的多个数据项提供给不同的算子。
在一个实施例中,该系统、方法和计算机程序产品将控制数据项传送给第二算子,其给第二算子指示一时间,以在该时间处处理已计算的多个数据项。在另一实施例中,该系统、方法和计算机程序产品预定连接到元端口的弧只接收多个控制数据项的子集。
在一个实施例中,该系统、方法和计算机程序产品将对应于在多个弧上流动的多个数据项的分层数据模型中层级的重复部分的粒子归类。
在一个实施例中,该系统、方法和计算机程序产品将多个控制数据项耦合到外部资源运算,以便指示所述外部资源运算的开始或完成。在另一实施例中,该系统、方法和计算机程序产品包括使用多个算子对多个数据项的并行执行。在又一实施例中,该系统、方法和计算机程序产品从包括流水线执行和数据并行执行的组中选择该并行执行。
在一个实施例中,该系统、方法和计算机程序产品包括一个或多个声明状态的算子,其累积在包括在粒子中的多个数据项上的状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710192727.4/2.html,转载请声明来源钻瓜专利网。