[发明专利]一种RAID盘组故障自动下线报修方法及系统在审
申请号: | 202011059284.3 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112162705A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 白淑贤;李国平;李源;邱春武;白成刚 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06;G06F11/07 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 郭智 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 raid 故障 自动 下线 报修 方法 系统 | ||
本发明实施例提供一种RAID盘组故障自动下线报修方法及系统,其中,所述方法包括:循环遍历服务器上的RAID盘组,获取服务器上每一个RAID盘组的读写性能、状态及寿命;根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定,并根据判定结果对RAID盘组进行剔除下线;将剔除下线的RAID盘组的日志信息写入本地故障日志;根据记录的本地故障日志向报修接口发送报修报警。根据本发明的技术方案,通过监测盘组的当前使用状态、盘组的寿命及盘组的读写性能来自动判断故障RAID盘组或者是疑似故障的RAID盘组,根据设定时间进行一次检测,故障发现及时准确。
技术领域
本发明涉及计算机领域,具体涉及一种RAID盘组故障自动下线报修方法及系统。
背景技术
RAID盘组指的是磁盘阵列,简单来说就是由N块独立的磁盘,组合成一个容量巨大的逻辑磁盘组。这个偌大的磁盘组主要作用就是存储CDN服务所用的资源,支撑线上CDN服务能够正常的运作。
RAID盘组故障是指磁盘硬件资源由于某种原因导致读写异常甚至不工作的情况。线上正在运行的服务器如果出现了故障盘组没有处理,或者处理不及时,有可能会对服务造成影响,因此为了避免影响服务,要尽可能将故障盘组剔除下线。
现有故障RAID盘组下线及报修方法如下:
步骤一:异常场景1:监控RAID盘组状态,如果有故障盘组,会发出报警到报警系统;异常场景2:监控业务指标,如果发现业务指标异常,会发出报警到报警系统;
步骤二:运维人员收到报警,判断是否是RAID盘组状态异常或者是RAID盘组读写异常造成业务指标波动;
步骤三:手动剔除故障RAID盘组;
步骤四:将故障RAID盘组的详细信息收集好,提交报修申请。
在实现本发明的过程中,发现现有技术中存在以下缺点:
1、故障发现不够及时:依靠人工收到的报警发现故障显然很滞后。
2、故障定位不够准确:监控RAID盘组的状态并不能完全涵盖盘组的异常情况。例如:盘组的状态正常,但是盘组的年限接近过保,会造成盘组读写异常,此时需要人工花费大量的时间来定位问题。
3、剔除故障的RAID盘组不够及时:前面两点将导致故障的RAID盘组没有在第一时间进行剔除,从而造成对CDN服务的影响。
4、故障RAID盘组报修不够及时:故障的RAID盘组需要人工搜集相关的异常日志信息并提交报修申请,此步骤是人工处理,受不可控因素影响很有可能会遗忘,导致故障盘组没有及时的报修,服务器上的盘组越来越少,间接性影响CDN服务。
发明内容
本发明实施例提供一种RAID盘组故障自动下线报修方法及装置,结合多项指标来判断RAID盘组是否故障;程序通过监测盘组的当前使用状态、盘组的寿命及盘组的读写性能来自动判断故障RAID盘组或者是疑似故障的RAID盘组,根据设定时间进行一次检测,故障发现及时准确。
为达到上述目的,一方面,本发明实施例提供了一种RAID盘组故障自动下线报修方法,所述方法包括:
循环遍历服务器上的RAID盘组,获取服务器上每一个RAID盘组的读写性能、状态
及寿命;
根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定,并根据判定
结果对RAID盘组进行剔除下线;
将剔除下线的RAID盘组的日志信息写入本地故障日志;
根据记录的本地故障日志向报修接口发送报修报警。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011059284.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车档位传感装置
- 下一篇:一种汽车教学用实训装置