[发明专利]用于执行从第一适配器到第二适配器的失效转移操作的方法和系统在审
| 申请号: | 201410681770.7 | 申请日: | 2014-11-24 |
| 公开(公告)号: | CN104714905A | 公开(公告)日: | 2015-06-17 |
| 发明(设计)人: | O·卡多纳;M·R·奥克斯;V·塞西 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F13/28 | 分类号: | G06F13/28 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
| 地址: | 美国纽*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 执行 第一 适配器 第二 失效 转移 操作 方法 系统 | ||
技术领域
本申请一般性地涉及一种改进的数据处理装置和方法,并且具体地涉及用于准备好针对低延时有状态卸载通信适配器的失效转移能力的机制。
背景技术
现代通信适配器,例如网络设配器、输入/输出(I/O)适配器等,使用诸如远程直接存储器访问(RDMA)的协议来为低延时通信提供基于硬件的有状态卸载。有状态卸载是指将通常由主机计算系统执行的一些处理卸载到通信适配器的能力。例如,传输控制协议(TCP)卸载引擎(TOE)是通信适配器的有状态卸载引擎的一种示例,并且是用在网络接口卡(NIC)中以将整个TCP/IP栈的处理卸载到NIC的网络控制器的技术。RDMA是从一台计算设备的存储器到另一台计算设备的存储器中的无需涉及任一计算设备的操作系统的直接存储器访问。
当执行有状态卸载操作的通信适配器在将适配器耦合到主机系统的交换结构中经历停机时,主机系统丢失了适配器中的被卸载状态。这使得在没有应用停机的情况下为这样的有状态适配器提供具有透明失效转移的高可用性解决方案是困难的。
已知的机制试图通过利用被称为自动路径迁移(APM)的机制来解决这个问题。APM机制运行在适配器内部,并且当检测到通信连接失效时,试图自动发现从适配器到网络的替换路径,诸如经由适配器的另一物理端口。然而,APM机制被限制于经由同一适配器或主机通道适配器(HCA),即经由同一适配器/HCA的另一物理端口,来发现到交换结构的替换路径。因此,当适配器或HCA的所有端口遭受停机时,APM机制不能提供替换路径。
发明内容
在一个说明性的实施例中,一种在包括第一适配器和第二适配器的数据处理系统中用于执行从第一适配器到第二适配器的失效转移操作的方法。该方法包括:检测第一适配器的即将发生的失效有可能发生。该方法进一步包括:响应于检测到即将发生的失效,在第一适配器和第二适配器中发起失效转移准备操作。失效转移准备操作将第二适配器的入口缓冲器和出口缓冲器配置为具有与第一适配器的入口缓冲器和出口缓冲器类似的配置。此外,该方法包括:在第一适配器的失效之前,将入口数据流量迁移到第二适配器的处理,使得第一适配器处理来自数据处理系统的出口数据流量并且第二适配器处理去往数据处理系统的入口数据流量。
在其他说明性的实施例中,提供了一种计算机程序产品,该计算机程序产品包括具有计算机可读程序的计算机可用或可读介质。当在计算设备上被执行时,该计算机可读程序使得该计算设备执行上面关于方法的说明性实施例而概述的操作中的各种操作以及这些操作的组合。
在又另一说明性实施例中,提供了一种系统/装置。该系统/装置可以包括一个或多个处理器以及耦合至该一个或多个处理器的存储器。该存储器可以包括指令,当由该一个或多个处理器执行时,这些指令使得该一个或多个处理器执行上面关于方法的说明性实施例而概述的操作中的各种操作以及这些操作的组合。
本发明的这些及其他特征和优点将被描述于本发明的示例实施例的以下详细描述中,或者鉴于本发明的示例实施例的以下详细描述而对本领域的技术人员将是明显的。
附图说明
本发明及其优选的使用模式以及进一步的目标和优点,将在结合附图地阅读说明性实施例的以下详细描述时通过参考该详细描述而被最好地理解,在附图中:
图1描绘了示例分布式数据处理系统的图形表示,在该示例分布式数据处理系统中,说明性实施例的各方面可以被实施;
图2是示例数据处理系统的框图,在该示例数据处理系统中,说明性实施例的各方面可以被实施;
图3图示了根据一个说明性实施例的包括主适配器和次级或备用适配器的失效转移系统的实施例;
图4A-4B图示了概括根据一个说明性实施例的用于执行失效转移准备和失效转移操作的示例操作的流程图。
具体实施方式
诸如远程直接存储器访问(RDMA)的现代输入/输出(IO)技术使用了具有完全有状态卸载能力的IO适配器。如上面提及的,RDMA是如下的功能:允许从一台计算机的存储器到另一台计算机、计算设备(诸如IO适配器)等的存储器中的直接存储器访问,而无需涉及任一计算机的操作系统。RDMA促进了高吞吐量、低延时联网,这在大规模并行计算机集群中尤其有用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司;,未经国际商业机器公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410681770.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用以触发数据源的方法及系统
- 下一篇:一种基于计数器的粗结构目录设计方法





