[发明专利]一种基于树模板的链接数据关键词查询方法在审
申请号: | 201811033735.9 | 申请日: | 2018-09-05 |
公开(公告)号: | CN109271560A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 李慧颖;司马强 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
地址: | 211189 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 树模板 链接数据 查询关键词 索引 关键词查询 查询结果 快速查找 结构化查询 结构字符串 内容字符串 查询效率 构造查询 建立索引 快速查询 树结构 转换 返回 响应 创建 恢复 | ||
本发明公开了一种基于树模板的链接数据关键词查询方法,包括:将链接数据转换为D‑step树模板并建立索引,在树模板基础上快速查找包括查询关键词的D‑step树并生成查询结果。本发明将链接数据划分为若干D‑step树,在此基础上创建并索引D‑step树模板。D‑step树模板对D‑step树的内容和结构分开进行索引,内容字符串序列用于快速查找包括查询关键词的D‑step树,结构字符串序列用于恢复D‑step树结构并生成查询结果。由于本发明在树模板索引基础上实现,不需将查询关键词转换为结构化查询,而是在链接数据上直接构造查询结果并返回。实现了快速查询响应,提高了查询效率。
技术领域
本发明属于信息检索技术领域,涉及数据查询方法,更为具体的说,是涉及计算机根据用户输入的查询关键词搜索链接数据集并将查询结果返回的方法。
背景技术
链接数据的关键词查询是指根据用户的查询关键词,在链接数据图中查询并将包含查询关键词的子图作为查询结果返回。链接数据的关键词查询技术有利于帮助用户从大规模链接数据中获取其感兴趣的数据和信息。随着链接数据的大量增加,普通用户对其进行查询的需求也在不断增加。虽然存在形式化查询语言支持对链接数据查询,但它们对普通用户而言过于复杂,原因在于其要求用户必须掌握查询语言的语法规则和待查询数据的模式信息。而基于关键词的查询技术对于普通用户而言更加简便,因此,提供关键词查询方式对链接数据的检索和重用成为一个重要问题。
当前链接数据的关键词查询使用了多种技术方法,包括查询转换方法和直接查询方法。查询转换方法主要关注将关键词查询转换为形式化查询的过程。首先,匹配查询关键词到链接数据图的顶点或边。在模板或模式信息的辅助下,找到查询关键词之间的关联,确定用户的查询对象。最后,构造符合语法规则的形式化查询语句,将其排序返回。用户通过选择查询语句向链接数据发起查询并获得最终查询结果。这类方法需要依赖链接数据模式信息确定查询关键词之间的关联。直接查询方法以链接数据图为基础,定义查询结果(确定满足何种条件的子图为查询结果),建立相关索引以支持快速查询响应,利用查询算法找到候选查询结果,将查询结果返回给用户。由于需要首先将关键词转化成形式化查询语句,步骤多,效率较为低下。
发明内容
为解决上述问题,本发明公开了一种基于树模板的链接数据关键词查询方法,封装链接数据文本和结构信息到D-step树,由于在D-step树模板索引的基础上,不需要进行关键词到形式化查询的转化,直接返回查询结果,实现了快速查询响应。
为了达到上述目的,本发明提供如下技术方案:
一种基于树模板的链接数据关键词查询方法,包括以下步骤:
步骤1,将链接数据图划分为若干D-step树
对于给定的链接数据图G,以入度为0的节点为D-step树的根节点,从根节点开始对G 进行广度优先遍历,将遍历到的每个节点都加入到D-step树中直到树的高度超过D或遇到了出度为0的节点,D取大于0的整数;
步骤2,创建并索引D-step树模板
对于给定的D-step树T={V,E,L},D-step树模板对D-step树的内容和结构分开进行索引,其中索引内容字符串序列用于快速查找包括查询关键词的D-step树,结构字符串序列用于恢复D-step树结构并生成查询结果;
步骤3,进行关键词查询
首先根据树模板的内容字符串序列获得包含每个查询关键词的树模板,利用结构字符串恢复该树模板对应的D-step树并构建查询结果,最终查询结果是D-step树中的一棵包含所有查询关键词的子树并且该子树每一个叶子节点都至少与一个关键词相关联,树根则为所有命中节点的公共节点。
进一步的,所述步骤1中链接数据图为顶点和边都带有标签的有向图,以RDF三元组的主体和客体作为顶点,以三元组的谓词作为从主体指向客体的有向边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811033735.9/2.html,转载请声明来源钻瓜专利网。