[发明专利]利用连接表压缩数据图的方法和设备无效
| 申请号: | 200810055809.9 | 申请日: | 2008-01-09 |
| 公开(公告)号: | CN101196933A | 公开(公告)日: | 2008-06-11 |
| 发明(设计)人: | 王珊;张俊;彭朝辉 | 申请(专利权)人: | 王珊 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京中创阳光知识产权代理有限责任公司 | 代理人: | 尹振启 |
| 地址: | 100872*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 利用 连接 压缩 数据 方法 设备 | ||
技术领域
本发明涉及一种利用连接表来对数据图进行压缩的方法及用于实现该方法的设备。
背景技术
数据图(Data Graph)是关系数据库支持关键词检索的一个重要数据模型。基于数据图,目前已经开发出许多关系数据库关键词搜索(Keyword Search OverRational Databases,KSORD)系统,这些基于数据图的KSORD系统,都是假设数据图可以完全装入内存中,实现基于内存的数据图搜索算法。但是,一方面,许多大规模数据库对应的数据图可能太大而不能被装入内存中,那些基于内存的数据图搜索算法可以处理的数据库规模也因此受到限制。另一方面,数据图越大,不但消耗的内存越多,基于该数据图的搜索算法查询效率也会越低,而且搜索过程中消耗的内存也越多。
关系数据库通常是用SQL或者RQI来访问的,而KSORD使得普通用户可以通过关键词查询方式来访问关系数据库,就像使用Web搜索引擎来检索Web信息一样。近年来,KSORD成为一个热点研究领域,许多技术人员提出各种各样的方法来实现KSORD,并且研制出相应的原型系统。下面将对KSORD技术进行进一步的阐述:
● KSORD属于数据库(Database)和信息检索(Information Retrieval,IR)的交叉研究,研究在关系数据库管理系统(Relational Database ManagementSystem,RDBMS)中实现IR的功能,如关键词查询、返回前k个结果的Top-k查询、相关性反馈、结果排序和结果分类等功能。
●KSORD使得普通用户使用简单的关键词查询就可以访问关系数据库,而不用知道或理解数据库模式。
●KSORD一般基于RDBMS的全文索引(Full-text Index)机制实现。RDBMS的全文检索采用SQL查询,需要指明查询表名、字段名等模式信息。
● KSORD返回的结果是单个元组(Tuple)或元组连接树(Join Tree ofTuples,JTT),可以把由于关系规范化而分散到多个表、多个元组中的信息重新组装成完整的信息呈现给用户。其中元组即为表中的记录;关系是指表。(本申请中提到的元组、关系等都指什么、它们与记录、表之间的关系请在此处加以说明。)
通过对现有技术中的SQL技术及关键词查询技术进行比较,可以发现SQL访问方式最难用、而关键词查询访问方式相对简单、灵活方便。关键词查询可以表达丰富的查询语义,如“Vagelis Hristidis VLDB Keyword Search”可以表达:
●Vagelis Hristidis在VLDB国际会议上发表的关于Keyword Search论文;
●Vagelis Hristidis关于Keyword Search方面的论文引用哪些VLDB论文;
●Vagelis Hristidis的VLDB论文引用哪些Keyword Search方面的论文;
●Vagelis Hristidis的论文引用哪些Keyword Search方面的VLDB论文。
同一个关键词查询可以表达丰富多彩的查询语义,这是关键词查询的优点,同时也是关键词查询的缺点,更是关键词查询的难点。这是因为关键词查询不能准确表达用户指定的查询语义,不像SQL和RQI访问方式可以明确指定查询语义。但是目前已经开发出了许多技术来弥补关键词查询这个缺点,使得用户可以快速准确地找到需要的信息,例如Top-k查询、相关性反馈、结果排序、结果分类和语义检索等技术。
对于SQL及ROI等查询方式,由于已经为本领域技术人员的熟知,此处不再赘述。
发明内容
基于上述问题,本发明中提出了一种利用连接表来压缩数据图的方法以及实现该方法的设备。
根据本发明的利用连接表来压缩数据图的方法,其特征在于包括以下步骤:识别连接表;生成非连接表元组对应的数据图节点;对于不属于连接表的外键生成对应数据图节点的边;根据所识别的连接表,将其所引用的两个主键节点连接(JOIN)在一起,从而在通过连接表所关联的每对元组所对应的两个数据图节点之间生成一条新边。
根据本发明的利用连接表来压缩数据图的设备,其特征在于包括:识别模块,用于识别连接表;节点生成模块,用于生成非连接表元组对应的数据图节点;边生成模块,对于不属于连接表的外键生成对应数据图节点的边;连接模块,用于根据所识别的连接表将其所引用的两个主键节点连接(JOIN)在一起,在通过连接表所关联的每对元组所对应的两个数据图节点之间生成一条新边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王珊,未经王珊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810055809.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





