[发明专利]基于raid卡日志的硬盘的故障定位方法及装置有效
申请号: | 201310046008.7 | 申请日: | 2013-02-05 |
公开(公告)号: | CN103207820A | 公开(公告)日: | 2013-07-17 |
发明(设计)人: | 刘亮;王雁鹏;王晓静;魏伟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/34 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 raid 日志 硬盘 故障 定位 方法 装置 | ||
技术领域
本发明涉及信息存储技术领域,特别涉及一种基于raid卡日志的硬盘的故障定位方法及装置。
背景技术
针对企业服务器中使用的LSI(Large-scale integration,大规模集成电路)型raid(Redundant Arrays of Inexpensive Disks,磁盘阵列)卡硬盘的故障检测,现有技术利用raid卡厂商提供的库或者工具,读取raid卡下各硬盘/SSD(Solid State Disk,固态硬盘)的状态,以及故障计数;当硬盘状态不正常,或者故障计数超过阈值的时候,触发故障报警,然而当硬盘/SSD严重故障,导致raid卡系统已无法识别时,raid卡控制器会把相应盘踢除出raid阵列,不再记录此盘任何相关的状态和故障信息,因此会导致现有的技术手段对已经发生物理掉盘的硬盘的故障漏报。
发明内容
本发明旨在至少解决上述技术问题之一。
为此,本发明的一个目的在于提出一种能够达到对硬盘运行故障检测有较全的覆盖率,且可以大幅度提高硬盘监控和检测的准确度,提高服务器运维效率的基于raid卡日志的硬盘故障定位方法。
本发明的另一目的在于提出一种基于raid卡日志的硬盘故障定位装置。
为了实现上述目的,本发明第一方面的实施例提出了一种基于raid卡日志的硬盘的故障定位方法,其中,在磁盘阵列raid卡和服务器之间设置异步实时推送接口,且所述服务器中设置有异步事件处理引擎,所述硬盘故障定位方法包括如下步骤:所述raid卡通过所述异步实时推送接口将raid卡日志实时推送至所述异步事件处理引擎;监测工具分析硬盘的当前状态,如果所述硬盘的逻辑盘处于降级degraded状态或者下线offline状态,则判断所述硬盘出现故障;在判断所述硬盘出现故障时,所述异步事件处理引擎对所述raid卡日志进行分析以获取与掉盘相关的日志信息,并将所述与掉盘相关的日志信息推送至所述服务器的内存以生成本地raid卡日志;所述监测工具在所述本地raid卡日志中抓取所述磁盘的物理盘的多条变迁事件记录,并根据多条所述变迁事件记录获取所述硬盘的最终状态;以及所述监测工具将所述硬盘的当前状态和最终状态进行比对,如果所述硬盘的当前状态和最终状态不匹配,则判断所述硬盘的物理盘发生掉盘。
根据本发明实施例的基于raid卡日志的硬盘的故障定位方法,结合硬盘当前的运行健康信息和分析raid卡的日志,能够达到对硬盘运行故障检测有较全的覆盖率,且大幅度提高了硬盘监控和检测的准确度,提高了服务器的运维效率。
另外,根据本发明上述实施例的基于raid卡日志的硬盘的故障定位方法还可以具有如下附加的技术特征:
在本发明的实施例中,如果所述硬盘的当前状态和最终状态匹配,则判断所述硬盘发生故障。
在本发明的实施例中,所述异步事件处理引擎在获得所述与掉盘相关的日志信息后,还包括如下步骤:对所述与掉盘相关的日志信息进行格式化处理, 将格式化处理后的日志信息推送至所述服务器的内存。
在本发明的实施例中,所述变迁事件记录所述硬盘的变迁状态,包括:正常状态变迁到故障状态、故障状态变迁到正常状态、故障状态变迁到异常状态。
在本发明的实施例中,所述根据多条所述变迁事件记录获取所述硬盘的最终状态,包括如下步骤:对多条所述变迁事件记录的时间进行分析,获取最后时间的一条变迁事件记录,得到所述硬盘的最终状态。
本发明第二方面的实施例还提出了一种基于raid卡日志的硬盘的故障定位装置,包括:监测工具、raid卡、服务器和异步实时推送接口,其中所述异步实时推送接口位于所述raid卡和所述服务器之间,所述raid卡用于通过所述异步实时推送接口将raid卡日志实时推送至所述服务器;所述服务器包括异步事件处理引擎,所述异步事件处理引擎用于通过所述异步实时推送接口接收所述raid卡日志,并在所述硬盘出现故障时,对所述raid卡日志进行分析以获取与掉盘相关的日志信息,并将所述与掉盘相关的日志信息推送至所述服务器的内存以生成本地raid卡日志;所述监测工具用于分析硬盘的当前状态,如果所述硬盘的逻辑盘处于降级degraded状态或者下线offline状态,则判断所述硬盘出现故障,并在所述本地raid卡日志中抓取所述磁盘的物理盘的多条变迁事件记录,并根据多条所述变迁事件记录获取所述硬盘的最终状态,以及将所述硬盘的当前状态和最终状态进行比对,如果所述硬盘的当前状态和最终状态不匹配,则判断所述硬盘的物理盘发生掉盘。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310046008.7/2.html,转载请声明来源钻瓜专利网。