[发明专利]利用连接表压缩数据图的方法和设备无效

专利信息
申请号: 200810055809.9 申请日: 2008-01-09
公开(公告)号: CN101196933A 公开(公告)日: 2008-06-11
发明(设计)人: 王珊;张俊;彭朝辉 申请(专利权)人: 王珊
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京中创阳光知识产权代理有限责任公司 代理人: 尹振启
地址: 100872*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 利用 连接 压缩 数据 方法 设备
【说明书】:

技术领域

发明涉及一种利用连接表来对数据图进行压缩的方法及用于实现该方法的设备。

背景技术

数据图(Data Graph)是关系数据库支持关键词检索的一个重要数据模型。基于数据图,目前已经开发出许多关系数据库关键词搜索(Keyword Search OverRational Databases,KSORD)系统,这些基于数据图的KSORD系统,都是假设数据图可以完全装入内存中,实现基于内存的数据图搜索算法。但是,一方面,许多大规模数据库对应的数据图可能太大而不能被装入内存中,那些基于内存的数据图搜索算法可以处理的数据库规模也因此受到限制。另一方面,数据图越大,不但消耗的内存越多,基于该数据图的搜索算法查询效率也会越低,而且搜索过程中消耗的内存也越多。

关系数据库通常是用SQL或者RQI来访问的,而KSORD使得普通用户可以通过关键词查询方式来访问关系数据库,就像使用Web搜索引擎来检索Web信息一样。近年来,KSORD成为一个热点研究领域,许多技术人员提出各种各样的方法来实现KSORD,并且研制出相应的原型系统。下面将对KSORD技术进行进一步的阐述:

● KSORD属于数据库(Database)和信息检索(Information Retrieval,IR)的交叉研究,研究在关系数据库管理系统(Relational Database ManagementSystem,RDBMS)中实现IR的功能,如关键词查询、返回前k个结果的Top-k查询、相关性反馈、结果排序和结果分类等功能。

●KSORD使得普通用户使用简单的关键词查询就可以访问关系数据库,而不用知道或理解数据库模式。

●KSORD一般基于RDBMS的全文索引(Full-text Index)机制实现。RDBMS的全文检索采用SQL查询,需要指明查询表名、字段名等模式信息。

● KSORD返回的结果是单个元组(Tuple)或元组连接树(Join Tree ofTuples,JTT),可以把由于关系规范化而分散到多个表、多个元组中的信息重新组装成完整的信息呈现给用户。其中元组即为表中的记录;关系是指表。(本申请中提到的元组、关系等都指什么、它们与记录、表之间的关系请在此处加以说明。)

通过对现有技术中的SQL技术及关键词查询技术进行比较,可以发现SQL访问方式最难用、而关键词查询访问方式相对简单、灵活方便。关键词查询可以表达丰富的查询语义,如“Vagelis Hristidis VLDB Keyword Search”可以表达:

●Vagelis Hristidis在VLDB国际会议上发表的关于Keyword Search论文;

●Vagelis Hristidis关于Keyword Search方面的论文引用哪些VLDB论文;

●Vagelis Hristidis的VLDB论文引用哪些Keyword Search方面的论文;

●Vagelis Hristidis的论文引用哪些Keyword Search方面的VLDB论文。

同一个关键词查询可以表达丰富多彩的查询语义,这是关键词查询的优点,同时也是关键词查询的缺点,更是关键词查询的难点。这是因为关键词查询不能准确表达用户指定的查询语义,不像SQL和RQI访问方式可以明确指定查询语义。但是目前已经开发出了许多技术来弥补关键词查询这个缺点,使得用户可以快速准确地找到需要的信息,例如Top-k查询、相关性反馈、结果排序、结果分类和语义检索等技术。

对于SQL及ROI等查询方式,由于已经为本领域技术人员的熟知,此处不再赘述。

发明内容

基于上述问题,本发明中提出了一种利用连接表来压缩数据图的方法以及实现该方法的设备。

根据本发明的利用连接表来压缩数据图的方法,其特征在于包括以下步骤:识别连接表;生成非连接表元组对应的数据图节点;对于不属于连接表的外键生成对应数据图节点的边;根据所识别的连接表,将其所引用的两个主键节点连接(JOIN)在一起,从而在通过连接表所关联的每对元组所对应的两个数据图节点之间生成一条新边。

根据本发明的利用连接表来压缩数据图的设备,其特征在于包括:识别模块,用于识别连接表;节点生成模块,用于生成非连接表元组对应的数据图节点;边生成模块,对于不属于连接表的外键生成对应数据图节点的边;连接模块,用于根据所识别的连接表将其所引用的两个主键节点连接(JOIN)在一起,在通过连接表所关联的每对元组所对应的两个数据图节点之间生成一条新边。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王珊,未经王珊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810055809.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top