[发明专利]一种GPU故障诊断系统、诊断方法、设备及可读存储介质在审
| 申请号: | 202111007288.1 | 申请日: | 2021-08-30 |
| 公开(公告)号: | CN113777476A | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 张健;陈彬;刘海洲 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G01R31/30 | 分类号: | G01R31/30 |
| 代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 李修杰 |
| 地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 gpu 故障诊断 系统 诊断 方法 设备 可读 存储 介质 | ||
1.一种GPU故障诊断系统,其特征是,包括:
一键日志收集模块:用于实现一键收集系统带内日志、GPU故障日志及GPU运行状态指标文件;
故障日志巡检模块:对GPU日志进行巡检,输出故障信息并给出处理建议;
GPU实时状态检测模块:用于一键检测GPU实时运行状态,自动发现故障并给出处理建议;
GPU压力测试模块:用于GPU疑难故障的诊断;
GPU驱动一键更换模块:用于GPU驱动版本的一键更换;
日志模块:用于日志的输出及保存;
GPU驱动模块,用于保障GPU的运行。
2.如权利要求1所述一种GPU故障诊断系统,其特征是,还包括辅助引导模块,为一键日志收集模块、故障日志巡检模块、GPU实时状态检测模块或GPU压力测试模块定制引导菜单及说明,并根据检测到的故障给出处理建议。
3.如权利要求1所述一种GPU故障诊断系统,其特征是,所述故障日志巡检模块接收故障诊断策略,并对GPU日志进行巡检,输出故障信息并给出处理建议。
4.如权利要求1所述一种GPU故障诊断系统,其特征是,所述GPU压力测试模块集成多种GPU压测工具并实现一键调用。
5.如权利要求1所述一种GPU故障诊断系统,其特征是,所述GPU驱动一键更换模块可接收多个版本的驱动包,用于实现GPU驱动版本的一键更换,完成对多种型号GPU的适配及快速诊断。
6.采用权利要求1所述一种GPU故障诊断系统的诊断方法,其特征是,包括:
步骤一、判断GPU的驱动是否适配,如果不适配则利用GPU驱动一键更换模块更换驱动,如果适配则进入步骤二;
步骤二、根据需要进行功能选择;
步骤三、保存结果、保存日志并且输出诊断及维修建议。
7.如权利要求6所述的诊断方法,其特征是,所述步骤二中的功能选择包括选择一键日志收集模块、故障日志巡检模块、GPU实时状态检测模块或GPU压力测试模块。
8.如权利要求7所述的诊断方法,其特征是,当选择一键日志收集模块时,则执行一键收集系统日志的步骤;
当选择故障日志巡检模块时,则执行对GPU日志进行巡检,输出故障信息并给出处理建议的步骤;
当选择GPU实时状态检测模块时,则执行一键检测GPU实时运行状态,自动发现故障并给出处理建议的步骤;
当选择GPU压力测试模块时,则执行GPU疑难故障的诊断的步骤。
9.一种设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求6-8任意一项所述采用所述一种GPU故障诊断系统的诊断方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求6-8任意一项所述采用所述一种GPU故障诊断系统的诊断方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111007288.1/1.html,转载请声明来源钻瓜专利网。





