[发明专利]固态硬盘中垃圾回收的管理方法、存储介质和电子装置在审
申请号: | 202011336254.2 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112416814A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 李伟 | 申请(专利权)人: | 合肥大唐存储科技有限公司 |
主分类号: | G06F12/02 | 分类号: | G06F12/02;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 张建秀;李丹 |
地址: | 100094*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 固态 硬盘 垃圾 回收 管理 方法 存储 介质 电子 装置 | ||
1.一种固态硬盘中垃圾回收的管理方法,包括:
确定用于判断是否执行垃圾回收GC操作所需的配置参数;
将所述配置参数作为输入变量,将是否执行GC操作的判断结果作为输出变量,利用预先获取的历史数据,建立神经网络模型;
将当前状态下所述配置参数的取值作为输入信息,利用所述神经网络模型,计算所述输入信息对应的输出信息,得到当前状态下是否执行GC操作的判断结果;
向固态硬盘发送所述输出信息。
2.根据权利要求1所述的方法,其特征在于,所述配置参数包括如下至少一个:
GC操作待写入的数据总量a、能够使用的空闲block的总量b,主机端指令队列中包含的数据总量c、主机端有效数据的写入速率d以及GC操作的平均写入速率e。
3.根据权利要求1或2所述的方法,其特征在于,所述神经网络模型为马尔可夫决策过程,其中所述马尔可夫决策过程的计算表达式如下:
Pnext=T(Pcurr,Acurr);
其中,Pnext为下一时刻的状态变量,Pcurr为当前的状态变量,Acurr为所选动作变量,其中Pcurr和Acurr分别是状态变量集合P和动作变量集合A的子集;
其中,状态变量集合P中子集为所述历史数据中相同时刻下配置参数的取值;动作变量集合A的子集为执行GC操作或不执行GC操作。
4.根据权利要求3所述的方法,其特征在于,所述马尔可夫决策过程中的策略目标为写入放大WA趋于更小化以及写入性能的取值趋于更优化。
5.根据权利要求4所述的方法,其特征在于,所述马尔可夫决策过程在符合所述策略目标后,还设置有奖励函数,其中所述奖励函数的奖励值为临时奖励时,执行GC操作。
6.根据权利要求1所述的方法,其特征在于,所述向固态硬盘发送所述输出信息,所述方法还包括:
采集所述固态硬盘按照所述输出信息执行操作后配置参数的取值,得到采集结果;
利用所述采集结果对所述神经网络模型进行优化。
7.根据权利要求6所述的方法,其特征在于,所述利用所述采集结果对所述神经网络模型进行优化,包括:
利用深度Q网络,构建预测Q网络和目标Q网络,其中预测Q网络用于执行马尔可夫决策过程,得到计算在当前状态下各动作的Q值,目标Q网络用于执行包含马尔可夫决策过程和奖励函数的马尔可夫链,用以更新预测Q网络构建;
利用所述马尔可夫链对所述预测Q网络进行优化。
8.根据权利要求7所述的方法,其特征在于,采用如下计算表达式利用所述马尔可夫链对所述预测Q网络进行优化,包括:
Qp(Pcurr,A,L)=Qp(Pcurr,A,L)+α(R+γmaxQt(Pcurr,A,Lt)-Qp(Pcurr,A,L))2;
其中,Qp为预测Q网络,L为预测Q网络参数,γ为奖励递减值;α为神经网络学习率,Qt为目标Q网络,Lt为目标Q网络的参数。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至8任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至8任一项中所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥大唐存储科技有限公司,未经合肥大唐存储科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011336254.2/1.html,转载请声明来源钻瓜专利网。