[发明专利]一种HDFS的垃圾回收方法及装置在审
申请号: | 202011437627.5 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112540968A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 崔丽珺;杨全文;张洋 | 申请(专利权)人: | 中信银行股份有限公司 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/16;G06F16/174 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 hdfs 垃圾 回收 方法 装置 | ||
1.一种HDFS的垃圾回收方法,其中,所述方法包括:
获得第一删除指令;
根据所述第一删除指令,获得第一待删除文件大小信息;
获得预定文件大小阈值;
判断所述第一待删除文件大小信息是否大于所述预定文件大小阈值;
如果所述第一待删除文件大小信息不大于所述预定文件大小阈值,获得第一执行指令;
根据所述第一执行指令,执行所述第一删除指令,将第一待删除文件删除。
2.如权利要求1所述的方法,其中,所述判断所述第一待删除文件大小信息是否大于所述预定文件大小阈值之后,包括:
如果所述第一待删除文件大小信息大于所述预定文件大小阈值,获得第一判断指令;
根据所述第一判断指令,判断所述第一待删除文件是否为单一文件;
如果所述第一待删除文件为单一文件,获得第二删除指令;
根据所述第二删除指令,将所述第一待删除文件删除。
3.如权利要求2所述的方法,其中,所述根据所述第一判断指令,判断所述第一待删除文件是否为单一文件之后,包括:
如果所述第一待删除文件不是单一文件,获得第二判断指令;
根据所述第二判断指令,判断所述第一待删除文件中是否包含第一文件,所述第一文件为文件大小大于所述预定文件大小阈值的单一文件;
如果所述第一待删除文件中包含所述第一文件,获得第三删除指令;
根据所述第三删除指令,将所述第一文件删除。
4.如权利要求3所述的方法,其中,所述根据所述第二判断指令,判断所述第一待删除文件中是否包含文件大小大于所述预定文件大小阈值的单一文件之后,包括:
如果所述第一待删除文件中不包含所述第一文件,获得第一分组原则;
根据所述第一分组原则,将所述第一待删除文件分为N组,其中,N为大于0的整数;
获得第一预定提交频率信息;
根据所述第一预定提交频率信息,将N组待删除文件分别按照所述第一预定提交频率信息依次提交删除。
5.如权利要求1所述的方法,其中,所述获得第一执行指令之前,包括:
获得第三判断指令;
根据所述第三判断指令,判断所述第一待删除文件是否为单一文件;
如果所述第一待删除文件为单一文件,获得第一执行指令;
根据所述第一执行指令,执行所述第一删除指令,将所述第一待删除文件删除。
6.如权利要求2所述的方法,其中,所述根据所述第二删除指令,将所述第一待删除文件删除,包括:
获得第一预定切分阈值;
根据所述第一预定切分阈值,将所述第一待删除文件1切分为M组,其中,M为大于0的整数;
获得第二预定提交频率信息;
根据所述第二预定提交频率信息,将M组待删除文件分别按照所述第二预定提交频率信息依次提交删除。
7.如权利要求3所述的方法,其中,所述根据所述第三删除指令,将所述第一文件删除,包括:
获得第二预定切分阈值;
根据所述第二预定切分阈值,将所述第一文件切分为P组,其中,P为大于0的整数;
获得第三预定提交频率信息;
根据所述第三预定提交频率信息,将P组切分后的所述第一文件分别按照所述第三预定提交频率信息依次提交删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中信银行股份有限公司,未经中信银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011437627.5/1.html,转载请声明来源钻瓜专利网。