[发明专利]一种数字音频粗分层编码方法和装置有效
申请号: | 201310067789.8 | 申请日: | 2013-03-04 |
公开(公告)号: | CN103165135A | 公开(公告)日: | 2013-06-19 |
发明(设计)人: | 闫建新;王磊 | 申请(专利权)人: | 深圳广晟信源技术有限公司 |
主分类号: | G10L19/20 | 分类号: | G10L19/20;G10L19/008 |
代理公司: | 深圳市顺天达专利商标代理有限公司 44217 | 代理人: | 李琴 |
地址: | 518057 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数字音频 分层 编码 方法 装置 | ||
技术领域
本发明涉及音频编解码技术,更具体地说,涉及一种数字音频粗分层编码方法和装置。
背景技术
在分层音频编码上,已经存在通过精细分层方式进行的有损数字音频编码技术及无损音频编码技术。例如,ISO/IEC14496-3MPEG-4BSAC(Bit sliced arithmetic coding)比特片算术编码便提出了精细分层技术。在这种编码算法中,基于对MDCT(Modified Discrete Cosine Transform,修正离散余弦变换)变换后的变换域系数(频谱系数)被量化为整数后,从低频到高频分成多个组,每个组谱系数从高位到低位形成比特片方式进行算术编码,因此可以实现非常精细的分层(或者伸缩)编码。但是为了精细分层,需要考虑限制频谱分区长度等,从而导致降低编码效率。
例如,在AVS(Audio Video coding Standard Workgroup of China)中采用的类似于MPEG-4BSAC的编码方法,其中熵编码算法从算术编码换成了霍夫曼编码,编码原理相同。
在MPEG-4第三部分和MPEG-2第七部分中都提供了可伸缩采样率编码算法AAC-SSR(Advanced Audio Coding-Scalable Sampling Rate),首先是由Sony提出的,编码架构也类似于其独有的ARTAC(Adaptive Transform Acoustic Coding)编码。该编码算法首先将输入的数字音频信号通过4带的多相正交滤波器组(PQF,Polyphase Quadrature Filter)分割成四个频带,然后这四个频带分别进行一个256点MDCT(512样点窗长)或八个32点(64样点窗长)MDCT。该编码技术还可通过去除高PQF带的方式降低数据率,提供了一种通过减少频带的方式实现比特流分层,从而获得不同比特率和采样率,例如:
·4个频带:比特率=128kbit/s,采样率=48kHz,f_lowpass=20kHz;
·3个频带:比特率~120kbit/s,采样率=48kHz,f_lowpass=18kHz;
·2个频带:比特率~100kbit/s,采样率=24kHz,f_lowpass=12kHz;
·1个频带:比特率~65kbit/s,采样率=12kHz,f_lowpass=6kHz
这种编码技术的好处是在每个频带内可以独立选择长块或短块MDCT,因此对高频可使用短块编码增强时间分辨率,而对低频使用长块编码获得高频率分辨率。但是由于四个PQF带间存在混迭,因此相邻部分的变换域系数编码效率会下降。
MPEG-4SLS(Scalable Lossless Coding,可伸缩无损编码)有两种分层方式:一种是一个有损音频编码层(如AAC)和无损误差增强层,这样就保证了与原来有损编码的后向兼容;另外一种是没有有损编码层,仅仅无损增强层。在这两种方式中,无损增强层能够实现精细分层,提供低质量、高质量以及无损质量。但是,精细分层的方式存在编码效率低、结构复杂、处理逻辑复杂度高等缺点。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述精细分层的方式存在编码效率低、结构复杂、处理逻辑复杂度高的缺点,提供一种数字音频粗分层编码方法和装置。
本发明解决其技术问题所采用的技术方案是:提出一种数字音频粗分层编码方法,包括如下步骤:
S1、将数字音频信号分为一基本层和至少一增强层;
S2、对所述一基本层和至少一增强层分别进行编码;
其中,
所述步骤S1进一步包括:
S11、对于单声道音频信号,基于频带或残差分层结构将其分为一基本层和至少一增强层;
S12、对于立体声音频信号,基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层;
S13、对于多声道音频信号,基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层;
其中,
所述基于频带将数字音频信号分为一基本层和至少一增强层进一步包括:依次从低频到高频将每个频段的音频编码信息放入所述一基本层和至少一增强层;
所述基于声道将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输至少一声道,由所述至少一增强层传输至少另一声道,且所述基本层传输的声道的数量小于等于所述至少一增强层传输的声道的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳广晟信源技术有限公司,未经深圳广晟信源技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310067789.8/2.html,转载请声明来源钻瓜专利网。