[发明专利]一种名称数据的压缩、解压缩方法及设备有效
申请号: | 201310273457.5 | 申请日: | 2013-07-02 |
公开(公告)号: | CN104283567B | 公开(公告)日: | 2018-07-03 |
发明(设计)人: | 袁松安 | 申请(专利权)人: | 北京四维图新科技股份有限公司 |
主分类号: | H03M7/40 | 分类号: | H03M7/40 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100028 北京市朝阳区曙*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 名称数据 压缩编码 字符串集合 压缩 字符串 解压缩 名称数据库 哈夫曼二叉树 中字符串 字符生成 预设 覆盖 创建 | ||
1.一种名称数据的压缩方法,应用于服务器侧,其特征在于,包括:
针对包含有多个名称数据的预设名称数据库,生成覆盖所述名称数据库中所有名称数据的压缩字符串集合,所述压缩字符串集合中的字符串是基于各个名称数据的全部或部分字符生成的;
根据所述压缩字符串集合中字符串的频率,创建所述压缩字符串集合对应的哈夫曼二叉树,并生成一包括有所述压缩字符串集合中所有字符串的压缩编码的压缩编码表;
在对一名称数据进行压缩编码时,根据该名称数据所包含的字符串,从压缩编码表中获得各个字符串对应的压缩编码,组合得到该名称数据的压缩编码;
其中,所述压缩字符串集合为扫描整个名称数据库中的名称数据,从中统计出出现频率达到预定阈值的字符串,从所述字符串中选择出一个相容集合后得到。
2.如权利要求1所述的方法,其特征在于,
在生成所述压缩编码表时,进一步根据所获得的哈夫曼二叉树,生成一对应的状态转移表并发送给终端设备,该二叉树中的每个节点对应于一个状态,从根节点转移到叶子节点的连接上的编码,与该叶子节点的字符串相对应。
3.如权利要求1所述的方法,其特征在于,
所述生成覆盖所述名称数据库中所有名称数据的压缩字符串集合,包括:
步骤A,统计出现在名称数据中的所有字符串的出现频率;
步骤B,按照预定算法,计算每个字符串的价值,其中,所述预定算法使得计算得到的该字符串的价值,与该字符串的实际长度和出现频率正相关,与该字符串的编码后的预期长度负相关;
步骤C,从剩余字符串中选取价值最高的预设数量的字符串,未被选择的字符串构成当前的剩余字符串,所述剩余字符串的初始值为名称数据中出现的所有字符串;
步骤D,针对选择出的字符串,计算每一对组合之间共存概率,若共存概率低于预设门限,则将该对组合中价值较小的字符串删除;
步骤E,确定步骤D中的字符串的删除数量;
步骤F,判断选择次数是否大于预设次数门限,若大于,则进入步骤H,否则进入步骤E;
步骤G,从当前剩余字符串中选取所述删除数量的价值最高的字符串,返回步骤D;
步骤H,将选择出的、且未被删除的字符串,作为压缩字符串集合。
4.如权利要求1所述的方法,其特征在于,在对名称数据进行压缩编码时,若组合得到该名称数据的压缩编码不是字节的整数倍,则:
在压缩字符串集合存在有压缩编码长度大于8比特的字符串时,从该字符串的压缩编码的最高比特位开始,截取一定长度的编码,将该名称数据的压缩编码补足为字节的整数倍;
在压缩字符串集合不存在压缩编码长度大于8比特的字符串时,通过增加哑元字符串,利用哑元字符串的编码,将该名称数据的压缩编码补足为字节的整数倍。
5.一种名称数据的解压缩方法,应用于终端设备上,其特征在于,包括:
获得压缩字符串集合对应的哈夫曼二叉树转换得到的状态转移表,所述压缩字符串集合覆盖预设名称数据库中的所有名称数据,且是基于名称数据的全部或部分字符生成的;
获得名称数据的压缩编码;
利用所述状态转移表,对所述名称数据的压缩编码进行解码,得到压缩前的名称数据;
其中,所述压缩字符串集合为扫描整个名称数据库中的名称数据,从中统计出出现频率达到预定阈值的字符串,从所述字符串中选择出一个相容集合后得到。
6.如权利要求5所述的方法,其特征在于,
所述状态转移表包括多个单元,每个单元对应于一个状态下的一种输入,且每个单元中存储有转移后的转移状态和输出的字符串内容;
所述对所述名称数据的压缩编码进行解码,包括:
根据所述状态转移表,确定在输入所述名称数据的压缩编码后的转移状态及输出的字符串内容,得到输入的压缩编码对应的字符串内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京四维图新科技股份有限公司,未经北京四维图新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310273457.5/1.html,转载请声明来源钻瓜专利网。