[发明专利]一种SPARQL联合查询的数据源选择方法在审
申请号: | 202110065571.3 | 申请日: | 2021-01-13 |
公开(公告)号: | CN112749184A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 刘杰;冀俊宇;张磊;张凯;周建设 | 申请(专利权)人: | 首都师范大学 |
主分类号: | G06F16/242 | 分类号: | G06F16/242 |
代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 齐胜杰 |
地址: | 100048 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 sparql 联合 查询 数据源 选择 方法 | ||
本发明涉及一种SPARQL联合查询的数据源选择方法,方法包括:获取SPARQL语句;根据查询语句形成有向标签图;生成有向标签图对应的资源相关图;根据资源相关图选择数据源。本发明的方法根据查询语句形成有向标签图;生成有向标签图对应的资源相关图;根据资源相关图选择数据源,可以明显减少数据源选择的数量和选择时间。
技术领域
本发明涉及数据库技术领域,尤其涉及一种SPARQL联合查询的数据源选择方法。
背景技术
在数据源选择方法中,为了确保得到100%的召回率,大多数的SPARQL(全称为SPARQL Protocol and RDF Query Language,是为RDF开发的一种查询语言和数据获取协议)查询联合方法执行三元模式的数据源选择方法(TPWSS)。TPWSS的目标是确保找到各个查询三元模式的相关数据源。然而,由于某个数据源的查询结果在执行和其他在相同查询中的三元模式的结果连接后可能被排除,可能造成相关的资源并不能产生完整的最终查询结果集。这些数据源的过度选择增加了网络传输负担,而且对整个查询处理时间的影响很大。基于连接的数据源选择方法旨在选择出那些对三元模式结果有贡献和得到最后查询结果的三元模式的数据源。如果通过消除不需要的资源,数据源选择做的越好那么将可以获得越有效的查询执行计划。
HIBiscus是一个针对于TPWSS的基于连接的数据源选择方法,该方法以只选择出导致最后查询结果集的数据源为目标提出来的。该方法依赖于包含在数据源中的权限资源URI索引,根据不同的URI进行数据源查询,然后进行剪枝。它能够删除与最后查询结果集无关的源,从而提高查询处理时间。但是当URI相同时,这种方法就失效了。
发明内容
(一)要解决的技术问题
为了解决现有技术的上述问题,本发明提供一种SPARQL联合查询的数据源选择方法。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
一种SPARQL联合查询的数据源选择方法,所述方法包括:
S101,获取SPARQL语句;
S102,根据所述查询语句形成有向标签图;
S103,生成所述有向标签图对应的资源相关图;
S104,根据所述资源相关图选择数据源。
可选地,所述S102具体包括:
S102-1,确定查询语句中的三元组Gi,其中,i为三元组标识,任一三元组i包括主语si,谓语pi,宾语oi;
S102-2,将所有三元组中的主语、谓语、宾语形成集合V,并将V中每一个元素作为有向标签图G中的一个点;
S102-3,在每一三元组中si对应的点Vsi至oi对应的点Voi之间连接一条由Vsi指向Voi的边ei,将所有ei形成集合E,所述E中每一个元素作为有向标签图G中的一个边;其中,Vsi为边ei的头顶点,Voi为ei的尾顶点;
S102-4,确定每条边对应的数据源λei以及每两条边之间的连接节点类型λvt;
S102-5,形成有向标签图G=(V,E,λe,λvt)。
可选地,连接节点类型λvt为如下的一种:星型,路径型,汇聚型;
所述星型中两条边的头顶点相同;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学,未经首都师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110065571.3/2.html,转载请声明来源钻瓜专利网。