[发明专利]一种web图的索引数据压缩方法有效

专利信息
申请号: 201810921025.3 申请日: 2018-08-14
公开(公告)号: CN109255090B 公开(公告)日: 2021-08-03
发明(设计)人: 王芳;冯丹;张永选 申请(专利权)人: 华中科技大学
主分类号: G06F16/958 分类号: G06F16/958;G06F16/901
代理公司: 华中科技大学专利中心 42201 代理人: 李智;曹葆青
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种web图的索引数据压缩方法,通过索引数据分块,将索引数据(度数和位移)分成包含数百到数千个节点的块之后,则大部分块中只包含低度数节点,此时这些块中的度数和位移差值通常都可以用一到两个字节存放,也就可以达到50%以上的索引数据压缩率(由之前的4个字节压缩到一到两个字节)提高了可压缩性;通过度数和位移的码字交叉存放,这种交叉存放使得同一个节点的度数和位移的码字以很高的概率位于在同一个高速缓存行里面,因此可以大大提高高速缓存命中率;通过定长编码实现真正的随机访问,定长编码使得节点的压缩后的索引数据的下标可以通过计算得出,并根据下标进行真正的随机访问,提高了解压速度。
搜索关键词: 一种 web 索引 数据压缩 方法
【主权项】:
1.一种web图的索引数据压缩方法,其特征在于,该方法包括以下步骤:S1.将邻接列表数组压缩后的web图的待压缩的索引数据划分为等长索引数据块;S2.对于当前索引数据块,将压缩索引数组的当前下标放入块索引数组中起始下标域内,将第一个初始位移的码字放入块索引的参考位移域内;S3.对于当前索引数据块,基于当前索引数据块的初始度数最大值确定当前索引数据块度数的码字长度;S4.将当前索引数据块度数的码字长度放入块索引的度数码字长度域内,将第一个初始度数的码字存入压缩索引数组中;S5.对于当前索引数据块,计算剩余的初始位移和参考位移的差值,基于位移差值最大值确定当前索引数据块的位移差值的码字长度;S6.将当前索引数据块的位移差值的码字长度放入块索引的位移差值码字长度域内,将当前索引数据块剩下的度数码字和位移差值码字交叉放入压缩索引数组中;S7.重复步骤S2‑S6,直至所有的索引数据块都被压缩。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810921025.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top