[发明专利]一种基于磁盘的IO耗时监控方法、系统、存储介质及设备在审
申请号: | 202210466856.2 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114936124A | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 刘骏;张旭芳 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/07 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰;朝鲁蒙 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 磁盘 io 耗时 监控 方法 系统 存储 介质 设备 | ||
本发明提供了一种基于磁盘的IO耗时监控方法、系统、存储介质及设备,方法包括:响应于监测到文件系统生成IO请求,通过监控程序对IO请求对应的数据读写至磁盘的总过程进行监控,总过程依次包括系统内核处理过程、IO调度程序处理过程以及硬件处理过程;在监控过程中分别获得系统内核处理过程、IO调度程序处理过程以及硬件处理过程的IO耗时,并分别判断各项IO耗时是否超过对应的预设阈值;响应于若干项IO耗时超过对应的预设阈值,发出相应的告警信息。本发明通过监控系统内核处理过程、IO调度程序处理过程以及硬件处理过程,并通过监测其IO耗时来确定IO耗时高时具体是哪个过程出了问题,以便于采取对应的修复措施,确保磁盘IO的读写性能正常。
技术领域
本发明涉及存储技术领域,尤其涉及一种基于磁盘的IO耗时监控方法、系统、存储介质及设备。
背景技术
在服务器工作过程中,当磁盘出现IO(数据输入Input/输出Output)耗时高导致性能下降时,可能的原因有系统内核的问题、IO调度策略的问题,也可能有磁盘相关硬件方面的问题。
在系统内核方面,可能会由于处理器占用率过高、内存不足、中断处理超时等导致的IO任务积压,或处理器、PCIE(peripheral component interconnect express,一种高速串行计算机扩展总线标准)、操作系统相关的节能设置,或内核BUG(故障)、磁盘相关驱动BUG等方面的原因,导致磁盘性能差或无法正常读写。
在IO调度策略方面,由于IO调度策略的作用是管理块设备的请求队列,它决定队列中的请求排列顺序,以及在什么时刻派发请求到磁盘设备,目的是减少磁盘的寻址时间,提高全局吞吐量。主要分为预测IO调度程序、完全公正排队IO调度程序、最终期限IO调度程序、空操作IO调度程序等。对于不同的磁盘类型,使用不同的IO调度程序,会达到不同的IO性能,比如,对于固态硬盘使用最终期限IO调度程序的性能会更高,而机械硬盘应使用完全公正排队IO调度程序的性能会更好,若使用了不合适的IO调度程序,会影响磁盘的IO性能。
在磁盘相关硬件方面,虽然磁盘的容量和性能随着技术发展不断进步,但在磁盘的使用过程中,机械硬盘的坏道和固态硬盘的坏块是不可避免的。机械硬盘的坏道大多由震动、冲击或异常断电等原因引发,硬盘在通电工作时,由于高速运转的盘片与磁头之间距离非常小,轻微的震动或挤压有可能造成对盘片表面磁性记录材质的损坏,从而产生坏道;固态硬盘虽然没有机械活动部件,不存在物理坏道的问题,但固态硬盘的闪存颗粒有擦写次数以及坏块的问题,对特定存储单元反复擦写将会加速坏块的产生。当磁盘出现坏道或坏块之后,在对应位置的数据可能出现读写困难、磁头或存储单元反复重试读写的问题,将会影响数据IO的性能,造成对应的磁盘性能异常的问题;并且如果不及时修复或隔离,随着磁盘坏块或坏道的不断积累扩散,它会对磁盘容量产生破坏性的影响,甚至可能会导致磁盘无法读写或失效。
在发现磁盘IO异常,处理磁盘的IO性能问题时,通常会采用系统监控工具iostat及blktrace来分析。iostat工具不能区分出系统软件和硬件的耗时情况,无法作为评估硬件性能的指标。而blktrace工具虽然能记录所监控的时间区间内,每个IO经历的各个阶段的时间戳及耗时百分比,但它只能体现文件系统块(block)的耗时,不能体现读写物理磁盘扇区(sector)的耗时情况。
发明内容
有鉴于此,本发明的目的在于提出一种基于磁盘的IO耗时监控方法、系统、存储介质及设备,用以对磁盘的IO耗时进行具体且全面地监控。
基于上述目的,本发明提供了一种基于磁盘的IO耗时监控方法,包括以下步骤:
响应于监测到文件系统生成IO请求,通过监控程序对IO请求对应的数据读写至磁盘的总过程进行监控,总过程依次包括系统内核处理过程、IO调度程序处理过程以及硬件处理过程;
在监控过程中分别获得系统内核处理过程、IO调度程序处理过程以及硬件处理过程的IO耗时,并分别判断各项IO耗时是否超过对应的预设阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210466856.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:相机状态的切换方法和装置
- 下一篇:一种灭弧室产品的冲铆加工方法