[发明专利]控制通道故障确定方法及其装置有效
申请号: | 201210119188.2 | 申请日: | 2012-04-20 |
公开(公告)号: | CN102664755A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 王锋;游君平 | 申请(专利权)人: | 杭州华三通信技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 杨春香;宋志强 |
地址: | 310053 浙江省杭州市高新技术产业*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制 通道 故障 确定 方法 及其 装置 | ||
技术领域
本发明涉及网络通信技术,特别涉及控制通道故障确定方法及其装置。
背景技术
在网络通信中,典型的分布式网络设备结构如图1所示,其至少包括以下几个单板:主控板、线卡板、交换网板和背板。其中,主控板、线卡板以及交换网板上都包含至少一个CPU,选举主控板上的Main CPU作为分布式网络设备的主CPU,将剩余的CPU作为非主CPU,主CPU至各个非主CPU之间的链路称为控制通道,图1示出了控制通道。
控制通道用于完成整个分布式网络设备控制层面的相关功能,如果出现故障,必将影响整个分布式网络设备的运行。参见图2,图2示出了现有控制通道检测机制原理图。如图2所示,该控制通道检测机制包括以下步骤:
步骤201,主CPU定期在分布式网络设备中单播发送检测报文。
步骤202,分布式网络设备中每一非主CPU收到主CPU发送的检测报文后,立刻回复确认报文至主CPU。
步骤203,主CPU如果在发送检测报文之后的一段时间内接收到来自一非主CPU回复的确认报文,则认定该非主CPU状态OK,也进一步认定本主CPU与该非主CPU之间的控制通道正常,否则,直接认定该非主CPU故障,通过硬件控制信号直接重启该非主CPU。
也就是说,在现有控制通道检测机制中,只要主CPU在发送检测报文之后的一定时间内接收不到非主CPU回复的确认报文就直接确定该非主CPU故障。但是,这种确定非主CPU故障的方式太过笼统,完全缺乏对分布式网络设备内部控制通道拓扑结构的深入分析,事实上,主CPU接收不到非主CPU回复的确认报文,并非仅因为非主CPU故障,非主CPU状态OK、但非主CPU与主CPU之间的单向控制通道故障或者主CPU与非主CPU之间的单向控制通道故障都会导致主CPU无法接收到确认报文,而这些控制通道故障是现有控制通道检测机制无法检测出来的。
发明内容
本发明提供了分布式网络设备及其控制通道故障确定方法,避免现有控制通道检测机制笼统确定故障所带来的问题。
本发明提供的技术方案包括:
一种控制通道故障确定方法,该方法应用于包含主CPU和非主CPU的分布式网络设备;该方法包括:
主CPU接收非主CPU的检测触发后,通过至非主CPU的主用控制通道向非主CPU发送携带了第一序列号的检测报文;
主CPU在发送检测报文的设定时间内收到非主CPU回复的携带了第二序列号的应答报文,比较该应答报文携带的第二序列号是否与所述第一序列号一致,如果否,则确定主CPU至非主CPU的主用控制通道故障。
一种分布式网络设备上控制通道故障确定方法,所述分布式网络设备为分布式系统中的一个设备,包含主CPU和非主CPU,所述分布式系统由多个分布式网络设备逻辑组成;该方法包括:
从分布式系统中选择一个分布式网络设备上的主CPU作为系统主CPU;
分布式网络设备的主CPU被选择为系统主CPU时,通过至非系统主CPU的主用控制通道发送携带了序列号1的检测报文至非系统主CPU,并在发送该检测报文的第一设定时间内收到非系统主CPU回复的携带了序列号2的应答报文,比较该应答报文携带的序列号2是否与所述序列号1一致,如果否,则确定系统主CPU至非系统主CPU的主用控制通道故障;其中,非系统主CPU为分布式系统中除系统主CPU所在分布式网络设备之外任一分布式网络设备上的主CPU和非主CPU;
分布式网络设备上的主CPU未被选择为系统主CPU时,针对系统主CPU发送的检测报文回复应答报文,以及按照如权利要求1至3任一所述的主CPU执行的操作执行。
一种应用于控制通道故障确定的装置,该装置为分布式网络设备的主CPU;包括:
检测单元,用于接收非主CPU的检测触发后,通过至非主CPU的主用控制通道向非主CPU发送携带了第一序列号的检测报文;
第一故障确定单元,用于在所述检测单元发送检测报文的设定时间内收到非主CPU回复的携带了第二序列号的应答报文,比较该应答报文携带的第二序列号是否与所述第一序列号一致,如果否,则确定主CPU至非主CPU的主用控制通道故障。
一种应用于控制通道故障确定的装置,该装置为分布式网络设备的主CPU,所述分布式网络设备为分布式系统中的一个设备,所述分布式系统由多个分布式网络设备逻辑组成;所述装置包括:
选择模块,用于从分布式系统中选择一个分布式网络设备上的主CPU作为系统主CPU;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州华三通信技术有限公司,未经杭州华三通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210119188.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:以太网帧处理方法及装置
- 下一篇:软开关隔离型开关电容调节器