[发明专利]基于云计算的大数据检索方法在审
申请号: | 201510629459.2 | 申请日: | 2015-09-29 |
公开(公告)号: | CN105205158A | 公开(公告)日: | 2015-12-30 |
发明(设计)人: | 赖真霖;文君 | 申请(专利权)人: | 成都四象联创科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 杨春 |
地址: | 611730 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 计算 数据 检索 方法 | ||
技术领域
本发明涉及数据处理,特别涉及一种基于云计算的大数据检索方法。
背景技术
云计算系统能够提供海量存储、可靠服务,因此日益受到重视。在云基础设施中,由成千上万台互相连接在一起的计算机构成提供服务的“云”,大量的用户可以同时共享这块“云”,并根据自己的实际需求对所需资源进行剪裁。作为云数据处理中的一个重要组成部分,当前的云存储系统绝大部分都采用分布式散列表的方式来构建索引,数据被组织成键值对的形式。因此,这类云存储系统只支持关键字查找,并通过点式检索来访问数据。然而,在对于如今发展起来的大数据的实际应用中,用户可能倾向于采用多个键值来进行多维度检索,此时现有的解决方案只能通过运行一个后台批处理任务来扫描整个数据集然后得到检索结果。然而,这类解决方案缺乏实时性,新存入的数据元组不能被及时地检索到,必须等到后台的批处理任务完成扫描才可被检索。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种基于云计算的大数据检索方法,包括:
一种基于云计算的大数据检索方法,其特征在于,包括:
将云存储系统的索引结构分为主索引和本地索引两级,将数据内容存储于本地索引中,并在主索引中利用链式队列为所有的本地索引发布的元数据建立索引,通过元数据的关联实现检索。
优选地,所述将云存储系统的索引结构分为主索引和本地索引两级,进一步包括:
1)对下级的云存储系统的存储空间进行划分,按照等量和有序的原则设定好各本地索引管理的空间范围;
2)按照步骤1)分配好的本地索引管理的空间范围,将云存储系统中的数据映射到对应的本地索引中,当映射过程完成以后,各本地索引内部以及各本地索引之间均为有序;
3)下级的各本地索引分别将其最高级的节点发布到上级的主索引中,主索引通过下级发布过来的节点,构造全局的链式队列索引,然后将各本地索引关联起来,构成完整的索引空间;
4)下级各本地索引逐步向下进行节点的迭代发布,根据发布后预估的检索速度增加比和发布后主索引内存占用的增长比,来判断是否要继续向下发布本地索引的节点;若预估检索速度增加比低于主索引内存占用增加比,则停止向下级发布。
优选地,所述通过元数据的关联实现检索,进一步包括:
首先以主索引作为检索的入口,通过检索主索引,来确定实际包含待检索数据的本地索引;其次,将检索处理转发给该本地索引,由该本地索引检索到确定的数据后,直接返回给检索请求的发起者,具体步骤包括:
1)将待检索的区间发送给上级的云平台服务器,主索引以区间的下界作为检索的入口键,在主索引中进行检索;2)当上级的主索引根据下界的键定位到具体本地索引后,将检索处理转发给发布该键的下级本地索引;3)当本地索引接收到转发来的检索处理请求时,首先根据待检索的区间,遍历自己的索引,直至满足检索区间的上界为止;若待检索的区间已检索一个本地索引的管理范围,则将检索请求转发给该本地索引的后继兄弟,将检索到的数据集直接从本地索引返回给检索的请求端。
优选地:在提交数据更新之前,每个事务先检查在该事务读取数据后,有没有其他事务修改了该数据;如果其他事务有更新,将正在提交的事务进行回滚;所述的链式队列每个节点中还包含2个标志位和1个锁;其中,marked标志位用于标识该节点是否正在被删除;linked标志位标识该节点是否完全插入,即所有层次的指针域都更新完毕,每一个节点分别维护一个锁lock;另外还定义2个哨兵节点head和tail,其键值分别为常数min_int和max_int;
所述链式队列的定位操作首先从哨兵节点head的最高级开始查找,依次下降,每一级查找到待查询键值k所在位置或者哨兵节点tail停止,如果找到k对应的节点,则更新节点i表示该节点的最高级,记录其每级对应的前驱节点pre[i];
所述链式队列的插入操作包括:
1)首先调用定位操作,返回定位的结果,如果找到当前节点,即键值为k的节点已经存在,不能插入,否则,进入步骤2的操作;
2)对前驱节点数组pre自下向上加锁;
3)验证返回的pre和后继节点数组succ的下一节点是否发生变化,若pre和succ的下一节点发生变化,则先释放刚才的锁,然后重新定位pre和succ;如果pre和succ都没有发生了变化,进行步骤4;
4)从底级开始向上进行插入操作,然后置linked标志位为true,表示插入节点已经完全链接,最后释放所有的锁;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都四象联创科技有限公司,未经成都四象联创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510629459.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置