[发明专利]基于关系型数据库及K-D树索引的文件数据管理方法有效
| 申请号: | 201410316850.2 | 申请日: | 2014-07-03 |
| 公开(公告)号: | CN104063487A | 公开(公告)日: | 2014-09-24 |
| 发明(设计)人: | 杜震洪;张丰;刘仁义;郑少楠;郭绿奕 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 关系 数据库 索引 文件 数据管理 方法 | ||
1.一种基于关系型数据库及K-D树索引的文件数据管理方法,其特征在于,包括如下步骤:
(1)采用一致性哈希算法对文件进行分布存储,将文件的MD5值作为该文件的哈希值,将哈希值与集群中的服务器建立映射关系,从而将不同哈希值的文件分布到不同的服务器上;
(2)在元数据管理服务器端构建关系型数据库,对文件元数据库表结构进行设计,文件元数据库表字段包括:文件存储路径、是否删除、上传时间;
(3)根据文件元数据库表字段数量,构建多维检索树;
(4)判断元数据管理服务器端接收的客户端发送的检索请求,如检索请求类型为模糊查找,将该请求自动转发到步骤2构建的关系型数据库中进行模糊检索;如检索请求类型为属性范围查找,则调用步骤3构建的多维检索树,返回查询结果;
(5)在元数据管理服务器空闲时,重新建立平衡的多维检索树。
2.根据权利要求1所述的一种基于关系型数据库及K-D树索引的文件数据管理方法,其特征在于,所述步骤(1)中将哈希值与集群中的服务器建立映射关系具体为:给集群中的每个服务器分配随机标签,这些随机标签构成一个哈希环,存储文件时,计算文件主键哈希值,然后存放到哈希环顺时针方向中第一个大于或等于该哈希值所在的服务器节点。
3.根据权利要求1所述的一种基于关系型数据库及K-D树索引的文件数据管理方法,其特征在于,所述的步骤(3)具体为:k表示文件元数据库表字段个数,n表示多维检索树的层数,第 n 层中的每个节点,其左子树中每个节点的第n%k维属性小于或者等于该节点的n%k维属性,右子树中的每个节点的第n%k维属性大于或等于该节点的n%k维属性;在平衡状态下,多维检索树的检索性能O(logN), 并且支持O(N^(k-t/k))的范围查询效率,其中N表示文件数量,t为查询时指定的维度。
4.根据权利要求1所述的一种基于关系型数据库及K-D树索引的文件数据管理方法,其特征在于,所述的步骤(5)具体为:
(5.1)检索步骤2构建的关系型数据库的每个属性,将文件的第一维属性均摊分成两个部分,将中间节点插入到多维检索树;
(5.2)对文件的第二维属性进行与步骤5.1同样的处理,直到所有元数据信息按照维度全部载入到多维检索树中,最终得到平衡态的多维检索树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410316850.2/1.html,转载请声明来源钻瓜专利网。





