[发明专利]一种数据编码方法、系统、设备及计算机可读存储介质在审
| 申请号: | 202111032573.9 | 申请日: | 2021-09-03 |
| 公开(公告)号: | CN113852379A | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 秦臻;刘宇豪;张永兴 | 申请(专利权)人: | 山东云海国创云计算装备产业创新中心有限公司 |
| 主分类号: | H03M7/40 | 分类号: | H03M7/40 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王雨 |
| 地址: | 250001 山东省济南市自由贸易试验*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 编码 方法 系统 设备 计算机 可读 存储 介质 | ||
本申请公开了一种数据编码方法,获取待编码数据;统计待编码数据中的待编码字符及每个待编码字符的出现频率;基于待编码字符及出现频率生成初始霍夫曼树;判断初始霍夫曼树的深度是否大于预设深度;若初始霍夫曼树的深度大于预设深度,则基于预设编码表对待编码数据进行编码,得到初始编码数据,按照动态霍夫曼编码的编码格式对初始编码数据进行封装,得到目标编码数据。本申请中,在待编码数据的初始霍夫曼树深度大于预设深度之后,直接采用预设编码表对待编码数据进行编码,无需再对霍夫曼树中超出长度的叶子节点进行逐个处理,可以提高编码效率。本申请提供的一种数据编码系统、设备及计算机可读存储介质也解决了相应技术问题。
技术领域
本申请涉及信息处理技术领域,更具体地说,涉及一种数据编码方法、系统、设备及计算机可读存储介质。
背景技术
近几年来,随着科学技术的不断发展,数据信息呈现出爆炸时的增长。且云计算的兴起,人工智能的推进,大数据时代的到来,使得工作负载不断增大,海量数据传输和存储的问题不断引起关注,如何能够高效的传输海量数据,同时不对处理器造成过于沉重负荷的问题亟待解决。而对文件进行压缩的话,不仅可以节省数据流量,还可以降低传输时间,也即可以对数据进行压缩来对数据进行处理。比如通过动态霍夫曼编码(Dynamic HuffmanCoding)对数据进行压缩,然而,动态霍夫曼编码会设定最大码长,也即会设定霍夫曼树的最大深度,当霍夫曼树的实际深度大于该最大深度时,需要对超出长度的叶子节点进行逐个处理,将霍夫曼树的深度处理在要求的深度内,整个过程冗长繁琐,效率低。
综上所述,如何快速进行霍夫曼编码是目前本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种数据编码方法,其能在一定程度上解决如何快速进行霍夫曼编码的技术问题。本申请还提供了一种数据编码系统、设备及计算机可读存储介质。
为了实现上述目的,本申请提供如下技术方案:
一种数据编码方法,包括:
获取待编码数据;
统计所述待编码数据中的待编码字符及每个所述待编码字符的出现频率;
基于所述待编码字符及所述出现频率生成初始霍夫曼树;
判断所述初始霍夫曼树的深度是否大于预设深度;
若所述初始霍夫曼树的深度大于所述预设深度,则基于预设编码表对所述待编码数据进行编码,得到初始编码数据,按照动态霍夫曼编码的编码格式对所述初始编码数据进行封装,得到目标编码数据。
优选的,所述基于预设编码表对所述待编码数据进行编码,得到初始编码数据,包括:
确定所述待编码数据中重复出现且长度大于等于3的第一类字符;
统计各个所述第一类字符的长度;
确定所述待编码数据中单独出现的第二类字符;
基于所述预设编码表对所述第一类字符、所述长度、所述第二类字符进行编码,得到所述初始编码数据。
优选的,所述基于所述预设编码表对所述第一类字符、所述长度、所述第二类字符进行编码,得到所述初始编码数据,包括:
基于ASCII码表对所述第一类字符、所述第二类字符进行编码,得到第一编码结果;
基于霍夫曼长度编码表对所述长度进行编码,得到第二编码结果;
基于所述预设编码表对所述第一编码结果和所述第二编码结果进行编码,得到所述初始编码结果。
优选的,所述ASCII码表的编码结果为0到255间的整数;所述霍夫曼长度编码表的编码结果为257到285间的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东云海国创云计算装备产业创新中心有限公司,未经山东云海国创云计算装备产业创新中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111032573.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





