[发明专利]一种双控制器存储系统的服务和控制器状态监控方法有效
申请号: | 200910017117.X | 申请日: | 2009-07-09 |
公开(公告)号: | CN101594383A | 公开(公告)日: | 2009-12-02 |
发明(设计)人: | 施培任 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F9/46;H04L12/24 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 控制器 存储系统 服务 状态 监控 方法 | ||
技术领域
本发明涉及计算机存储和服务监控技术,具体地说是一种双控制器存储系统 的服务和控制器状态监控方法
技术背景
随着计算机信息广泛应用和发展,计算和数据的可靠性成为信息的核心,计 算机存储设备和系统的可靠性要求也越来越强,对于单个控制器的存储设备和系 统,若控制器发生故障(一般为硬件故障),存储服务就不可用,导致数据服务 中断甚至数据完整性受破坏。共享多个磁盘阵列RAID的双控控制器的存储设备和 系统实现了数据和服务的冗余互备,在双控制器存储系统在应用中发生一个控制 器故障时,另一个控制器应检测到并接管其所有服务。如何有效可靠地实现双控 制器存储系统的服务运行状态监控和故障接管是双控存储系统要解决的问题。
发明内容
本发明的目的是提供一种双控制器存储系统的服务和控制器状态监控方法。
本发明的目的是按以下方式实现的,针对双控存储系统服务监控的需求,本发 明解决了服务运行状态的监控和切换,并以控制器状态值简洁表示控制器服务运 行状态,以控制器状态为驱动来调整服务运行停止,相对以服务为切换单元的监 控方式。
为实现本发明的目的是通过双控节点间通信共享双控系统上的状态和服务运 行信息,当一节点服务运行异常或者定时心跳信息超时,则正常节点将按照设计 切换状态,并以该状态为目标调整控制器上相应服务运行和停止;
定义三个软件功能模块:节点通信模块COMM,集群服务管理模块CSM和本地服务 管理模块LSM。模块之间可相互通信,其中COMM模块主要功能是接收来自CSM模块 的信息并通过控制器通信介质传输给另一控制器COMM模块;CSM模块从COMM模块接 收对方控制器信息,从LSM模块接收本地服务组运行状态信息,决策本控制器的状 态值并发送给COMM模块和LSM模块;LSM模块从COMM模块获取状态值,调整并定时 检测服务组本地控制器服务组运行情况,通知CSM模块。两个控制器运行的状态分 别为active:active;takeover:standby和standby:takeover;
在确定本地控制器状态后,LSM模块定时查询本控制器状态并检测本地服务组 运行状态是否一致,若不一致则进行一致性调整,调整操作为尝试执行最多N次异 常服务的启动或停止,N为预设定的数值,大于等于0,调整操作可能会失败;CSM 模块从LSM获取服务组运行状态,并通过COMM模块循环接收和定时发送节点传输信 息;节点传输信息包括控制器状态和服务组各服务运行状态,运行或停止,CSM模 块每次获得对方传输的节点信息则将接收的时间记录,若对方控制器服务运行异 常,或者超过预设时间没有接收到对方节点信息,则接管对方服务组并更改本控 制器状态为takeover;
当本控制器在运行过程中由于检测到对方异常而进行状态变化时,若需要接管 对方控制器服务,则在接管之前执行一个预设定的程序,该程序一般是触发电子 开关重启或者停止对方控制器,彻底隔离对方控制器对服务资源的控制器;
当双控系统处于一个takeover,另一个standby状态,把它切到两控制器都是 active的状态,即active,active状态,方法是添加一个检测的标志,称为扩展状 态值,随同心跳信息一起传输,当有该扩展状态值为预设特定值时,则忽略对方 状态变化而不自动改变本控制器状态;切换时设置该扩展状态值为预设特定值并 更改该节点状态值,分别都更改为active状态,最后取消扩展状态值;
要停止双控系统中所有控制器,方法和从takeover,standby切换到 active,active类似,即使用扩展状态值并设置inactive状态,在相应所有服务停 止之后停止COMM,CSM,LSM模块;
当要重启或停止双控存储系统中单一控制器,且此时两控制器正在运行,方法 是先将非停止的控制器状态设置为takeover,再将要重启或停止的控制器状态设 置为inactive;具体控制步骤如下:
S1.置本地控制器状态为inactive,不启动任何服务组,并开始收发状态信息;
S2等待若干秒,秒数由系统启动时间差最大值决定,目的是保证两控制器同 时启动时能够最后相互达到相同状态;
S3若对方状态也为inactive,表明对方也在启动,则设置本地控制器状态为 active,执行步骤S7;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910017117.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:玻璃电极表面在线除垢装置
- 下一篇:用于按键寿命测试的压头装置