[发明专利]音频编码器和解码器有效
| 申请号: | 200880125539.2 | 申请日: | 2008-12-30 |
| 公开(公告)号: | CN101939781A | 公开(公告)日: | 2011-01-05 |
| 发明(设计)人: | P·H·海德林;P·J·卡尔森;J·L·萨缪尔森;M·舒格 | 申请(专利权)人: | 杜比国际公司 |
| 主分类号: | G10L19/00 | 分类号: | G10L19/00 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 李镇江 |
| 地址: | 荷兰阿*** | 国省代码: | 荷兰;NL |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 编码器 解码器 | ||
技术领域
本发明涉及音频信号的编码,具体而言,涉及对不仅限于语音、音乐或者其组合的任何音频信号的编码。
发明背景
在现有技术中,有专门设计为通过将编码基于信号的源模型,即,人的发音系统,来对语音信号进行编码的语音编码器。这些编码器不能处理诸如音乐或任何其他非语音信号之类的任意音频信号。另外,在现有技术中还有通常被称为音频编码器的音乐编码器,它们将编码基于人的听觉系统的构想,而不是基于信号的源模型。这些编码器可以很好地处理任意信号,但是对于低比特率的语音信号,专用的语音编码器提供了优良的音频质量。因此,到目前为止,还不存在用于编码任意音频信号的通用的编码结构,并且当以低比特率操作时,其既能作为针对语音的语音编码器又能作为针对音乐的音乐编码器。
因此,需要一种能改善音频质量和/或降低比特率的增强型音频编码器和解码器。
发明内容
本发明涉及以等于或好于专门针对特定信号定制的的系统的质量水平的质量水平有效地编码任意音频信号。
本发明涉及包含线性预测编码(LPC)和对经LPC处理的信号进行操作的变换编码器部分的音频编码解码器算法。
本发明进一步涉及取决于变换帧大小的量化策略。此外,还提出了使用算术编码的基于模型的熵约束量化器。另外,还可在均匀标量量化器中插入随机偏移。本发明进一步建议了使用算术编码的基于模型的量化器,例如,熵约束量化器(ECQ)。
本发明进一步涉及通过利用LPC数据的存在来有效地编码音频编码器变换编码部分中的比例因子。
本发明进一步涉及有效地利用带有可变帧大小的音频编码器中的比特储存器(reservoir)。
本发明进一步涉及用于对音频信号进行编码并生成比特流的编码器,以及用于对比特流进行解码并生成感觉上与输入的音频信号难区分的重构的音频信号的解码器。
本发明的第一方面涉及变换编码器中的、例如应用改进离散余弦变换(MDCT)的量化。所提出的量化器优选地量化MDCT线。不论编码器是否进一步使用线性预测编码(LPC)分析或额外的长期预测(LTP),此方面都适用。
本发明提供了一种音频编码系统,包括用于基于自适应滤波器过滤(滤波)输入信号的线性预测单元;用于将所述经滤波(filter)的输入信号的帧转换为变换域的变换单元;以及,用于量化所述变换域信号的量化单元。所述量化单元,基于输入信号特征,决定利用基于模型的量化器或非基于模型的量化器来编码所述变换域信号。优选地,决定是基于变换单元应用的帧大小来作出的。然而,也可以预见用于切换量化策略的其他输入信号依赖的准则,它们都在本申请的范围内。
本发明的另一个重要方面是量化器可以是自适应的。具体而言,基于模型的量化器中的模型可以是自适应的,以调整到输入音频信号。模型可以随着时间而变化,例如,取决于输入信号特征。这可以降低量化失真,并如此会改善编码质量。
根据一个实施例,所提出的量化策略取决于帧大小。还提出了,量化单元可以基于由变换单元应用的帧大小,决定利用基于模型的量化器或非基于模型的量化器来编码所述变换域信号。优选地,量化单元被配置成通过基于模型的熵约束量化,为帧大小小于阈值的帧编码变换域信号。基于模型的量化可以取决于分类的参数。大帧可以,例如通过带有例如基于赫夫曼的熵编码的标量量化器,来进行量化,如在,例如,AAC编解码器中所使用的。
音频编码系统还可以进一步包括长期预测(LTP)单元,用于基于所述经滤波的输入信号的前面的段的重构,来估计所述经滤波的输入信号的所述帧,以及变换域信号组合单元,用于在所述变换域中,组合所述长期预测估计和所述经变换的输入信号,以生成输入到量化单元中的所述变换域信号。
MDCT线的不同的量化方法之间的切换是本发明的优选实施例的另一个方面。通过对于不同的变换大小而使用不同的量化策略,编解码器可以在MDCT域中执行所有量化和编码,无需与变换域编解码器并联地或串联地运行特定的时域语音编码器。本发明教导了,对于有LTP增益的语音之类的信号,优选地,使用短的变换和基于模型的量化器来对信号进行编码。基于模型的量化器特别适合于短变换,并且如稍后将概述的,提供了时域语音特定的矢量量化器(VQ)的优点,而仍在MDCT域中操作,并且没有输入信号是语音信号的要求。换言之,当基于模型的量化器与LTP相结合地用于短变换段时,保留了专用时域语音编码器VQ的效率,而没有失去通用性,也没有离开MDCT域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880125539.2/2.html,转载请声明来源钻瓜专利网。





