[发明专利]基于多维特征的硬盘故障预测模型建立方法及其应用在审
申请号: | 202110943053.7 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113778766A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 谭支鹏;冯丹;万举;张鑫晏 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06K9/62;G06N3/08 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 夏倩;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多维 特征 硬盘 故障 预测 模型 建立 方法 及其 应用 | ||
1.一种基于多维特征的硬盘故障预测模型建立方法,其特征在于,包括:
预处理步骤:获得特征数据集,其中的每条样本包含硬盘状态、对应状态下的特征数据以及特征数据的产生时间;所述特征数据包括SMART信息、固件版本信息和事件日志信息,每类信息对应一个或多个数据项,每个数字类型的数据项取值为累积值,其他类型的数据项取值为编码后的数值;
数据集划分步骤:对所述特征数据集中的样本按时间升序排序后进行样本均衡和标准化,之后按照时间升序的顺序将特征数据集划分为训练集和测试集;
模型建立步骤:以样本中的特征数据为输入信息、硬盘状态为标签信息,利用所述训练集对深度学习模型进行训练,并利用所述测试集对训练后的所述深度学习模型进行测试,得到硬盘故障预测模型。
2.如权利要求1所述的基于多维特征的硬盘故障预测模型建立方法,其特征在于,所述模型建立步骤中,利用所述训练集对深度学习模型进行训练,包括:
(S1)将所述训练集按时间升序的顺序划分为N个数据块,并利用大小为n的滑动窗口取前n个数据块;其中,N和n均为正整数,且nN;
(S2)按照当前超参数组合设置所述深度学习模型的超参数,将所选取的n个数据块中的前n-1个数据块作为训练数据对所述深度学习模型进行训练,将第n个数据块作为验证数据,对训练后的所述深度学习模型的进行评分;
(S3)若所述滑动窗口还未到达所述训练集的末尾,则使所述滑动窗口向后滑动一个数据块,重新选取n个数据块,并转入步骤(S2);否则,计算当前超参数下所述深度学习模型的平均评分;
(S4)对于每一个超参数组合,分别执行步骤(S1)~(S3),从而确定使所述深度学习模型获得最高平均评分的超参数组合,并获得该超参数组合下的模型训练结果。
3.如权利要求2所述的基于多维特征的硬盘故障预测模型建立方法,其特征在于,所述步骤(S4)中,通过网格搜索的方式进行超参数调优,以获得多个超参数组合。
4.如权利要求1~3任一项所述的基于多维特征的硬盘故障预测模型建立方法,其特征在于,所述数据集划分步骤中,按照时间升序的顺序将特征数据集划分为训练集和测试集之前,还包括:
从所述特征数据中筛选出对硬盘状态的影响程度最大的多个数据项,并剔除其余数据项,以对所述特征数据集进行更新。
5.如权利要求4所述的基于多维特征的硬盘故障预测模型建立方法,其特征在于,从所述特征数据中筛选出对硬盘状态的影响程度最大的多个数据项,所采用的方法是基于机器学习算法的特征选择或基于相关性分析的特征选择。
6.如权利要求1~3任一项所述的基于多维特征的硬盘故障预测模型建立方法,其特征在于,所述数据集划分步骤中,所述样本均衡,包括:
将按时间升序顺序排序后的特征数据集按照预设时间段进行划分,对于每个时间段内的样本,随机抽取x*a*m/k条正常盘的样本,共抽取得到x*a*m条正常盘的样本;
将故障盘的样本数量扩充为x*a;
利用所抽取的正常盘的样本和扩充后的故障盘样本对所述特征数据集进行更新;
其中,x为样本均衡前所述特征数据集中故障盘的样本数量,a为故障盘样本的放大比例,1:m为预设的故障盘与正常盘的样本比例,k为划分得到的时间段总数。
7.如权利要求6所述的基于多维特征的硬盘故障预测模型建立方法,其特征在于,所述预设时间段为月。
8.一种基于多维特征的硬盘故障预测方法,其特征在于,包括:
获得硬盘当前的特征数据,进行标准化之后,输入由权利要求1~7任一项所述的基于多维特征的硬盘故障预测模型建立方法所建立的硬盘故障预测模型,以预测得到硬盘当前的状态。
9.一种计算机可读存储介质,其特征在于,包括:存储的计算机程序;所述计算机程序被处理器执行时,控制所述计算机可读存储介质所在设备执行权利要求1~7任一项所述的基于多维特征的硬盘故障预测模型建立方法,和/或权利要求8所述的基于多维特征的硬盘故障预测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110943053.7/1.html,转载请声明来源钻瓜专利网。