[发明专利]数据处理方法及相关装置有效
| 申请号: | 202010760588.6 | 申请日: | 2020-07-31 |
| 公开(公告)号: | CN111857603B | 公开(公告)日: | 2022-12-02 |
| 发明(设计)人: | 张伟益 | 申请(专利权)人: | 重庆紫光华山智安科技有限公司 |
| 主分类号: | G06F3/06 | 分类号: | G06F3/06 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 李莎 |
| 地址: | 400700 重庆市*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 相关 装置 | ||
本发明涉及分布式存储技术领域,提供了一种数据处理方法及相关装置,所述方法包括:接收客户端发送的写数据请求;若第一目标存储块与最近一次写数据请求写入的存储块相同,且第一目标存储单元和最近一次写数据请求写入的第二目标存储单元位置相邻,则将第一目标存储单元合并入第二目标存储单元对应的第一目标存储段;将第一目标存储单元的版本号递增;若递增后的第一目标存储单元的版本号大于第一目标存储段的版本号,则用递增后的第一目标存储单元的版本号更新第一目标存储段的版本号并将更新后的第一目标存储段的版本号发送至元数据节点进行存储。本发明能够极大地减少版本号占用的存储空间,提高了元数据节点存储空间的利用效率。
技术领域
本发明涉及分布式存储技术领域,具体而言,涉及一种数据处理方法及相关装置。
背景技术
现有的分布式存储系统中,存储节点通常包括多个存储块,每一存储块包括多个存储单元,待存储的数据首先按照纠删码进行编码,得到多个数据块和至少一个校验块,然后将多个数据块和校验块发送至不同的存储节点,由存储节点将收到的数据块或者校验块存储至本地的存储块中的存储单元中,为了便于对存储块中的存储单元进行管理,现有技术利用元数据节点为每一存储单元存储对应的版本号,当存储单元中的数据发生变化时,将该存储单元的版本号递增,当存储节点包括的存储单元的数量很大时,记录存储单元的版本号占用的存储空间也会随之膨胀,从而降低了元数据节点存储空间的利用效率。
发明内容
本发明的目的在于提供了一种数据处理方法及相关装置,其能够在写数据时将位置相邻的存储单元合并为一个存储段,并为每个存储段记录一个版本号,从而可以极大地减少版本号占用的存储空间,提高了元数据节点存储空间的利用效率。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明提供一种数据处理方法,应用于分布式存储系统中的存储节点,存储节点包括多个存储块,每一存储块包括多个存储单元,分布式存储系统还包括客户端和元数据节点,存储节点与客户端及元数据节点均通信连接,所述方法包括:接收客户端发送的写数据请求,其中,写数据请求中携带有待写地址,待写地址用于表征待写数据应写入的第一目标存储块及在第一目标存储块中的第一目标存储单元;若第一目标存储块与最近一次写数据请求写入的存储块相同,且第一目标存储单元和最近一次写数据请求写入的第二目标存储单元位置相邻,则将第一目标存储单元合并入第二目标存储单元对应的第一目标存储段;将第一目标存储单元的版本号递增;若递增后的第一目标存储单元的版本号大于第一目标存储段的版本号,则用递增后的第一目标存储单元的版本号更新第一目标存储段的版本号并将更新后的第一目标存储段的版本号发送至元数据节点进行存储。
第二方面,本发明提供一种数据处理方法,应用于分布式存储系统中的元数据节点,元数据节点与存储节点通信连接,所述方法还包括:当检测到对应同一组纠删码编码数据的多个存储节点中的第二目标存储段的版本号不一致时,将其中版本号最小的存储节点确定为待恢复节点,其中,第二目标存储段包括多个位置相邻的存储单元,元数据节点存储第二目标存储段的版本号;向待恢复节点发送恢复信息,以使待恢复节点依据恢复信息从除待恢复节点之外的存储节点中读取第二目标存储段中的数据、并根据读取的数据将待恢复节点中的数据恢复,其中,恢复信息包括多个存储节点中除待恢复节点之外的存储节点的信息、第二目标存储段的版本号、第二目标存储段的起始位置、及第二目标存储段的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆紫光华山智安科技有限公司,未经重庆紫光华山智安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010760588.6/2.html,转载请声明来源钻瓜专利网。





