[发明专利]PON接入系统中基于看门狗的异常检测记录装置及方法有效
申请号: | 201210192820.6 | 申请日: | 2012-06-13 |
公开(公告)号: | CN102761439A | 公开(公告)日: | 2012-10-31 |
发明(设计)人: | 陈志欣;艾滨;李凌;汪骏飞 | 申请(专利权)人: | 烽火通信科技股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04B10/08 |
代理公司: | 北京捷诚信通专利事务所(普通合伙) 11221 | 代理人: | 魏殿绅;庞炳良 |
地址: | 430074 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | pon 接入 系统 基于 看门狗 异常 检测 记录 装置 方法 | ||
技术领域
本发明涉及PON(Passive Optical Network,无源光网络)接入系统领域,特别是涉及一种PON接入系统中基于看门狗的异常检测记录装置及方法。
背景技术
看门狗分硬件看门狗和软件看门狗。硬件看门狗是一个定时器电路,其定时输出端连接到电路的复位端,程序在一定时间范围内对定时器清零(俗称“喂狗”)。程序正常工作时,定时器不能溢出,也就不能产生复位信号。如果程序出现故障,不在定时周期内复位看门狗,就使得看门狗定时器溢出,产生复位信号并重启系统。软件看门狗原理上一样,只是将硬件的定时器电路用处理器的内部定时器代替,可简化硬件电路设计,但在可靠性方面不如硬件定时器,例如系统内部定时器自身发生故障就无法检测到。还有同时通过硬件看门狗和软件看门狗相互监视,不仅加大系统开销,也不能解决全部问题,例如中断系统故障导致定时器中断失效。
看门狗本身不是用来解决系统出现的问题,在调试过程中发现的故障应该要查改设计本身的错误。加入看门狗的目的是对一些程序潜在错误和恶劣环境干扰等因素导致系统死机而在无人干预情况下自动恢复系统正常工作状态,看门狗也不能完全避免故障造成的损失,毕竟从发现故障到系统复位恢复正常这段时间内怠工。
在应用看门狗功能的保护系统中,如何在出现故障时及时复位来快地恢复系统业务一般是设计这种保护机制的重点,而往往忽略了问题的本身。随着EPON(Ethernet Passive Optical Network,以太网无源光网络)设备的广泛应用,设备的应用环境也越来越复杂,一旦由于某些原因导致设备异常,在主控盘异常时无需无人为干预的情况下,例如网管脱管、协议处理异常等,看门狗自动复位主盘,复位只是恢复系统的一种方法,往往破坏了故障现场的数据,不利于程序开发人员查看现象并定位故障,这样带来的后果就是不能彻底解决出现的问题,使得已出现过的问题反复出现,影响系统使用。
发明内容
本发明的目的是为了克服上述背景技术的不足,提供一种PON接入系统中基于看门狗的异常检测记录装置及方法,在主控盘异常时无需无人为干预的情况下自动复位主盘,及时恢复系统业务,降低用户损失,且在触发复位之前记录问题出现时的现场数据,有利于软件开发人员分析现象并定位故障,为分析和解决问题提供了重要的依据,有利于提高软件的质量。
本发明提供的PON接入系统中基于看门狗的异常检测记录装置,包括硬件看门狗定时器和软件看门狗中断定时器,还包括日志记录模块和命令行界面,所述软件看门狗中断定时器包括配置管理模块、分别与配置管理模块相连的任务状态检测模块和CPU利用率检测模块,配置管理模块与命令行界面相连,任务状态检测模块与日志记录模块相连,用于轮询系统任务状态;CPU利用率检测模块与硬件看门狗定时器相连,用于检测系统CPU利用率,任务状态检测模块与CPU利用率检测模块之间通过管道通信的方式进行通信;喂狗时通过软件看门狗中断定时器定时向硬件看门狗定时器输出一次复位信号;在检测到系统异常时置位一个标志位,日志记录模块记录系统的异常信息后,停止喂狗,复位主控盘并触发倒换。
基于上述装置,本发明提供的PON接入系统中基于看门狗的异常检测记录方法,包括以下步骤:S1、初始化时创建软件看门狗中断定时器和监视任务,定时向硬件看门狗定时器输出复位信号,并使能硬件看门狗定时器开始工作;监视任务定时轮询系统任务的状态,检测到挂起的异常任务时,记录异常日志和任务挂起前的任务调用函数轨迹,停止“喂狗”标志位置位,使硬件看门狗定时器超时并重启主控盘触发倒换;S2、软件看门狗中断定时器定时检测系统CPU利用率,如果CPU利用率为100%的时间超过配置的时间门限,则记录异常日志和任务挂起前的任务调用函数轨迹,再控制主盘重启触发主备倒换。
在上述技术方案中,步骤S1中所述软件看门狗中断定时器每隔0.5秒向硬件看门狗定时器输出一次复位信号。
在上述技术方案中,步骤S1中所述监视任务每隔3分钟轮询一次系统任务的状态。
在上述技术方案中,步骤S1中所述轮询系统任务的状态的流程如下:延时3分钟,选择操作,比较选择操作返回值的大小,若选择操作返回值等于0,则轮询任务状态,有任务挂起时,记录任务轨迹,停止喂狗标志位置位,进入下一次循环;没有任务挂起时,进入下一次循环;若选择操作返回值大于0,读取管道获取异常任务的ID,记录任务的名字和任务轨迹,停止喂狗标志位置位,进入下一次循环;若选择操作返回值小于0,则判定选择出错,进入下一次循环。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烽火通信科技股份有限公司,未经烽火通信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210192820.6/2.html,转载请声明来源钻瓜专利网。