[发明专利]由分布式计算机系统的一个硬件元件报告错误的方法无效
| 申请号: | 98105712.8 | 申请日: | 1998-03-17 |
| 公开(公告)号: | CN1197236A | 公开(公告)日: | 1998-10-28 |
| 发明(设计)人: | 克里斯廷·玛丽·德斯诺伊斯;德里克·勒鲁瓦·加米雷;安托万内特·伊莱恩·赫尔曼;罗伯特·弗雷德里克·斯塔基;弗朗西斯·艾尔弗雷德·坎普 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F11/00 | 分类号: | G06F11/00 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 马浩 |
| 地址: | 美国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分布式 计算机系统 一个 硬件 元件 报告 错误 方法 | ||
本发明通常涉及分布式计算机系统,并且尤其涉及使用这些系统的硬件组件来报告硬件组件所发现的错误。
本申请包括与下面申请的主题内容相关的主题内容,下面的申请与本申请转让给同一个受让人,并且与本发明在同一天申请。下面所列的申请在这里全部包含进来作为参考。
“由分布式计算机系统的一个硬件元件报告错误的系统”,由Desnoyers等人申请,序列号为08/838,389,(摘要号为PO9-97-045)。
典型地,一个分布式计算机系统包括大量的通过一个互连网络相互连接的处理器。这些处理器其中的一个具有监控计算机系统内设备故障的任务。例如,使用一个心搏型协议来定期轮询系统内的每一个设备以确定该设备是否处于工作状态。如果一个曾处于工作状态的设备不再处于工作状态,那么该处理器探查该设备以发现是否出现了错误。轮询所有设备所需要的时间随着系统规模的增长而成比例地增加。
当检测到一个故障时,该处理器需要与发生故障的设备进行通信以确定故障的原因,并且启动适当的恢复方案。例如,如果在互连网络内发生了一个故障,那么处理器需要与该网络进行通信,来检索互连网络所捕获到的故障信息,并且启动适当的恢复。然而,因为不能确保在互连网络和该处理器之间存在直接的连接,因此对于这种通信通常使用替代的机制。
在一个互连网络中当错误发生时,用于搜寻和检索故障信息的处理器的使用和用于检索错误信息的替代机制的进一步的使用都没有预期的有效。因此,需要一种更有效的向处理器报告错误的方法来提供服务。特别是,需要一种机制,其中报告由,例如,互连网络本身来执行,以替代处理器搜寻和检索故障信息。
通过在一个分布式计算机系统中提供一种报告错误的方法,现有技术的缺点得到了克服并且提供了附加的优点。当检测到一个错误时,该分布式计算机系统中的一个硬件元件产生一个错误信息。该错误信息然后被从该硬件元件转发到该分布式计算机系统的第一个指定的处理节点。
在一个例子中,该硬件元件包括或是一个开关元件或是一个通信适配器。
在另一个例子中,该错误信息的生成包括生成一个服务包,该服务包包括错误信息和到第一个指定的处理节点的路径
在另一种实施方式中,该硬件元件在收到第一个指定的处理节点已经收到错误信息的指示之前,收集附加的错误。当该硬件元件确认收到了第一个指定的处理节点已经收到错误信息的指示时,对应于这些附加错误的错误信息被转发给第一个指定的处理节点和/或第二个指定的处理节点。
在本发明的另外一种实施方式中,错误信息进一步被从该硬件元件发送到分布式计算机系统的第二个指定的处理节点。
本发明的错误报告能力使不再需要监测设备以发现故障,结果减少了对于路径或路径部分的竞争。此外,本发明的错误报告能力预防了系统中后继的错误包的堆积,并且允许系统的其它部分正常工作。本发明的错误报告能力通过使用系统内的硬件来实现,而不是软件或任何处理器逻辑。
另外的特征和优点通过本发明的技术来实现。本发明的其它实施方式和方面在这里被详细地描述,并且被认为是权利要求的发明的一部分。
被认为是本发明的主题内容被特别指出,并且在说明书结论部分的权利要求书中被明显地予以要求。本发明前面的和其它的主题、特征和优点将通过下面与附图相应的详细描述而显而易见,其中:
图1描述了包括并使用本发明的报告能力的一个分布式计算机系统的一个例子。
图2描述了依据本发明的原则图1中的分布式计算机系统的一个互连网络的一种实施方式,该分布式计算机系统中包括中间开关板。
图3描述了依据本发明的原则的一个开关元件的一个例子。
图4描述了依据本发明的原则,在报告由图3的开关元件检测到的错误时所使用的硬件服务逻辑的一种实施方式。
图5描述了依据本发明的原则,在由图3的开关元件确认复原服务包的接收和附加错误的转发过程中所使用的硬件服务逻辑的一种实施方式。
图6描述了依据本发明的原则图1的分布式计算机系统中的一个通信适配器的一个例子。
图7描述了依据本发明的原则在报告由图6的网络适配器所检测到的错误中所使用的硬件服务逻辑的一种实施方式。
依据本发明的原则,提供了一种报告能力,其中分布式计算机系统的硬件元件将错误状态报告给计算机系统中一个指定的处理节点。硬件元件报告错误,而无须软件或处理器逻辑。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/98105712.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:层压式锂离子电池及其制造方法
- 下一篇:连接表带的杆件和装有这种杆件的手表





