[发明专利]一种基于树模板的链接数据关键词查询方法在审
申请号: | 201811033735.9 | 申请日: | 2018-09-05 |
公开(公告)号: | CN109271560A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 李慧颖;司马强 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
地址: | 211189 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 树模板 链接数据 查询关键词 索引 关键词查询 查询结果 快速查找 结构化查询 结构字符串 内容字符串 查询效率 构造查询 建立索引 快速查询 树结构 转换 返回 响应 创建 恢复 | ||
1.一种基于树模板的链接数据关键词查询方法,其特征在于,包括以下步骤:
步骤1,将链接数据图划分为若干D-step树
对于给定的链接数据图G,以入度为0的节点为D-step树的根节点,从根节点开始对G进行广度优先遍历,将遍历到的每个节点都加入到D-step树中直到树的高度超过D或遇到了出度为0的节点,D取大于0的整数;
步骤2,创建并索引D-step树模板
对于给定的D-step树T={V,E,L},D-step树模板对D-step树的内容和结构分开进行索引,其中索引内容字符串序列用于快速查找包括查询关键词的D-step树,结构字符串序列用于恢复D-step树结构并生成查询结果;
步骤3,进行关键词查询
首先根据树模板的内容字符串序列获得包含每个查询关键词的树模板,利用结构字符串恢复该树模板对应的D-step树并构建查询结果,最终查询结果是D-step树中的一棵包含所有查询关键词的子树并且该子树每一个叶子节点都至少与一个关键词相关联,树根则为所有命中节点的公共节点。
2.根据权利要求1所述的基于树模板的链接数据关键词查询方法,其特征在于,所述步骤1中链接数据图为顶点和边都带有标签的有向图,以RDF三元组的主体和客体作为顶点,以三元组的谓词作为从主体指向客体的有向边。
3.根据权利要求1所述的基于树模板的链接数据关键词查询方法,其特征在于,所述步骤1中,当G中入度为0的节点划分完之后,依然会从G中剩余节点中选取入度为0的节点,作为D-step树的根,直至整个数据图G被划分完为止。
4.根据权利要求1所述的基于树模板的链接数据关键词查询方法,其特征在于,所述步骤2中的D-step树模板包括一个形如#v1#v2#...#vi#的内容字符串序列,和一个形如#(e1,null)#(e2,e3)#...#(en,em)的结构字符串序列,其中vi∈V,ei∈E,标签对(ei,ej)表明与边标签ei相关的边的结束点是与边标签ej相关的边的起始点。
5.根据权利要求4所述的基于树模板的链接数据关键词查询方法,其特征在于,所述步骤2中当ej为“null”时则表明与标签ei相关的边的起始点是D-step树的根节点。
6.根据权利要求1所述的基于树模板的链接数据关键词查询方法,其特征在于,所述步骤3中只要查询结果的树根不同,则认为查询结果不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811033735.9/1.html,转载请声明来源钻瓜专利网。