[发明专利]集群系统中数据处理方法及装置有效
申请号: | 201610827845.7 | 申请日: | 2012-12-12 |
公开(公告)号: | CN106445413B | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 刘强;孙全成;刘晓波;游俊;杨华镝;周丹;黄岩 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例对接收的数据流进行重复数据查询的时候,会根据代表数据流的第一特征值,确定每个第一特征值在所述集群系统中对应的第一物理节点,然后将代表数据流的第一特征值发送到确定的物理节点上进行重复数据查询,重复数据的查询流程不会因为集群系统中节点数的增加而改变,因此不会因为集群系统中节点数的增加而使每个节点的计算量也随之增加。 | ||
搜索关键词: | 集群 系统 数据处理 方法 装置 | ||
【主权项】:
1.一种集群系统中数据处理方法,其特征在于,包括:将当前物理节点接收的数据流进行划分得到m个数据块,获取每个数据块的指纹,按照第一算法获取代表所述数据流的n个第一特征值;其中,所述m为大于等于1的整数,n为大于等于1且小于等于m的整数;根据第二算法确定所述n个第一特征值中的每个第一特征值在所述集群系统中对应的第一物理节点;将所述每个第一特征值发送到对应的所述第一物理节点进行查询;其中,所述集群系统中的每个物理节点中包括缓存和存储区域;接收来自所述n个第一特征值对应的第一物理节点的响应消息,从所述响应消息中获取第一存储地址;将所述第一存储地址指向的存储区域中存储的数据块指纹与所述数据流划分得到的数据块的指纹进行比较,查询重复的数据块;将获取的不重复的数据块作为新数据块,获取代表所述新数据块的第二特征值;按照所述第二算法确定所述第二特征值对应的第二物理节点;将所述第二特征值和所述第二特征值所代表的数据块的存储地址之间的对应关系存储到对应的第二物理节点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610827845.7/,转载请声明来源钻瓜专利网。