[发明专利]基于聚类分块的只读兴趣点数据库压缩存储方法无效

专利信息
申请号: 200810106036.2 申请日: 2008-05-07
公开(公告)号: CN101271478A 公开(公告)日: 2008-09-24
发明(设计)人: 康建初;刘鹏;诸彤宇;黄坚 申请(专利权)人: 北京航空航天大学
主分类号: G06F17/30 分类号: G06F17/30;G01C21/26
代理公司: 北京科迪生专利代理有限责任公司 代理人: 贾玉忠;卢纪
地址: 100083*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 分块 只读 兴趣 数据库 压缩 存储 方法
【说明书】:

技术领域

发明涉及一种面向导航终端的基于聚类分块的只读兴趣点数据库压缩存储方法,属于智能交通领域的导航系统范畴。

背景技术

在导航电子地图中,包含着大量的兴趣点(POI,Point Of Interest)信息,例如公共设施、风景区、娱乐场所等等,以帮助驾驶者轻松找到目的地,并在行进过程中给予直观、精确的提示。用户对导航产品的满意程度,有相当部分取决于导航电子地图中POI信息的丰富程度。在车载导航发展最早、技术最先进的日本.导航电子地图中POI为1200万条,目前我国电子地图中POI达到500万条,预测将来至少要达到2000万。

POI信息一般包括以下几个属性:类别、所属省市区、名称、地址、电话、经度、纬度,前两者一般用来创建索引,其它属性均需作为数据保存到数据库中。

早期的数据库压缩大多数是以属性列为压缩粒度,采用一些经典的无损压缩算法如字典压缩、哈夫曼编码等通用算法进行压缩。这种压缩方法的缺点是不考虑数据库中数据的结构性,将数据库以数据流的形式进行压缩,压缩率不高。直到近几年,对数据库压缩方法的研究才转向数据库专用压缩方法的研究,目前已出现的成果有:

(1)面向块的增量压缩方法(Wee K.NG,Chinya V.Ravishankar.Relational databasecompression using augmented vector quantization[C].In Proc.Of ICDE,pages 540-549,1995)。该方法将数据库数据分块,每个块中序号居中的元组为代表元组,块内其他元组可以用代表元组加增量的方式表示。其压缩方法是对块内的元组用矢量量化的方法进行量化,压缩时用由矢量量化产生的编码和每个元组与其代表元组的增量共同组成的有序对来压缩元组,进而实现数据库的压缩。面向块的增量压缩方法的优点是能够有效压缩数据库并能够执行压缩数据库的查询操作,缺点是对于字符串也需要进行量化,因此只适用于元组包含小范围枚举型字符串和数值的情况。

(2)保序压缩技术(Gennady Antoshenkov,David B.Lomet,James Murray.Order preservingstring compression[J].In Proc.OfICDE,pages 655-663,1996)。该方法最初是采用压缩字典编码对数据库的多个字符串属性值进行压缩。它将字符串拆分为多个小字符串,利用变长的字典编码法对这些小字符串压缩,其拆分的方法依赖于编码字典的编码顺序,而与编码字典具有相同顺序的序号编码表则保证了保序的实现。由于保序压缩简单易于实现,随后许多通用编码方式如哈夫曼编码、算术编码都被应用到保序压缩技术中。其优点在于易于实现,缺点是压缩率不高,且只适用于多个字符串的情况。

(3)基于语义的压缩技术(Shivnath Babu,Minos N.Garofaiakis,Rajeev Rastogi.Spartan:Amodel-based semantic compression system for massive data tables([J].In SIGMOD,2001))。这是一种利用属性的语义和数据挖掘模型来实现压缩的方法。该方法利用可预见的数据关系和为个别属性指定的容错方式来为整个数据表的所有行构建分类衰退树模型,压缩时选择属性集的一个特定子集,该子集中没有已经压缩过的值,而衰退树则采用一定的学习方法和组合优化算法来对这些值进行预计,并产生预计结果,即压缩值。通过不断更新衰退树的属性集子集来实现整个数据库的压缩。其可预见的数据关系是基于属性语义的关系,而数据挖掘则应用在衰退树的预见运算中。基于语义的压缩技术是有损的数据库压缩方法,由于利用了属性的语义,在衰退树进行压缩前需要首先分析属性字段的语义信息,因而该压缩方法复杂而不易实现,且压缩率也不高。

(4)海量关系拆分压缩技术(骆吉洲,李建中,一种有效的关系数据库压缩方法,软件学报,16(2),2005:205-214)。这种方法是针对目前不断出现的海量关系数据库提出的一种专用压缩方法。该方法从海量关系数据库中分离出小值域属性组,将海量关系拆分,然后对小值域属性组所在的新关系进行压缩。压缩时需要先估计拆分压缩的压缩比,如果压缩比合理则进行拆分压缩,否则放弃拆分压缩。海量关系拆分压缩技术对海量数据库的压缩及二次压缩有较好的效果,但是由于小值域属性组的识别问题的NP完全性,使得拆分压缩复杂,代价过大,并且只适用于小值域的属性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810106036.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top