[发明专利]一种基于Hadoop的海量RDF数据分布式查询处理方法无效
| 申请号: | 201310037662.1 | 申请日: | 2013-01-31 |
| 公开(公告)号: | CN103116625A | 公开(公告)日: | 2013-05-22 |
| 发明(设计)人: | 张小洪;杨丹;李珩;谢娟;成正斌;洪明坚;葛永新;杨梦宁;徐玲;胡海波 | 申请(专利权)人: | 重庆大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 400044 *** | 国省代码: | 重庆;85 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于Hadoop平台的海量RDF数据分布式查询处理方法,属于计算机领域。所述方法主要包括以下步骤,步骤a:将RDF数据上传至HDFS中,通过Hadoop平台的MapReduce框架读取数据并存储在分布式数据库HBase中;步骤b:对用户提交的SPARQL查询语句段进行预处理,对语句进行解析并提取出其中的前缀声明、结果变量、图模式子句;c:还原图模式子句中的前缀字符,将还原后的图模式子句转化为树模型;d:分解树模型,以自底向上、自左向右的方式遍历树节点并生成匹配各节点的查询计划,将最终的查询计划发送到Hadoop平台;e:通过MapReduce框架从HBase中读取数据,按照查询计划执行分布式查询,最后按结果变量返回查询结果。 | ||
| 搜索关键词: | 一种 基于 hadoop 海量 rdf 数据 分布式 查询 处理 方法 | ||
【主权项】:
一种基于Hadoop的海量RDF数据分布式查询处理方法,利用MapReduce框架对存储于分布式数据库HBase中的RDF数据进行SPARQL查询,所述方法包括:步骤a:将RDF数据上传至HDFS中,通过Hadoop平台的MapReduce框架读取数据将其并行存储在HBase中;步骤b:对用户提交的SPARQL查询语句段进行预处理,对语句进行解析并提取出其中的前缀声明、结果变量、图模式子句;步骤c:还原图模式子句中的前缀字符,将还原后的图模式子句转化为树模型,以树的结构来表示查询语句的完整图模式;步骤d:分解树模型,以自底向上、自左向右的方式遍历树节点并生成匹配各节点的查询计划,并将查询计划发送到Hadoop平台;步骤e:通过MapReduce框架从HBase中读取数据,按照查询计划执行分布式查询,最后按结果变量返回查询结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310037662.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种门禁系统
- 下一篇:基于USB总线的虚拟仪器





