[发明专利]音频编码器、编码方法、解码器、解码方法以及经编码的音频信号有效
申请号: | 200880019699.9 | 申请日: | 2008-06-05 |
公开(公告)号: | CN101743586A | 公开(公告)日: | 2010-06-16 |
发明(设计)人: | J·赫尔;R·盖尔格;S·拜耳;G·福克斯;U·卡雷梅尔;N·里特尔巴克;B·格里尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/14 | 分类号: | G10L19/14 |
代理公司: | 江门嘉权专利商标事务所有限公司 44205 | 代理人: | 谭志强 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码器 编码 方法 解码器 解码 以及 信号 | ||
技术领域
本发明涉及源编码,特别涉及音频源编码,其中至少用具有不同编码算法的两种不同的音频编码器对音频信号进行处理。
背景技术
在低比特率音频和语音编码技术领域中,为了在给定比特率下,以尽可能好的主观质量对这类信号实现低比特率编码,传统情况下,可以采用若干不同的编码技术。用于一般音乐/声音信号的编码器旨在:通过根据利用感知模型(“感知音频编码”)从输入信号估计得到的掩蔽阈值曲线,对量化误差的频谱(或时间)形状予以成形的方式,从而对主观质量加以优化。另一方面,在以人类语言的生成模型为基础进行极低速率的语音编码,即利用线性预测编码(LPC)对人类声道的共振效应进行建模、同时对残余激励信号进行有效编码时,极低速率的语音编码的效率极高。
由于存在上述两种不同的方法,一般的音频编码器(如MPEG-1层3、或MPEG-2/4高级音频编码、AAC)由于未采用语音源模型,因而对于极低数据速率的语音信号,通常无法得到同专用的基于LPC的语音编码器相媲美的良好性能。反之,由于基于LPC的语音编码器无法根据掩蔽阈值曲线灵活地对编码失真的频谱包络加以成形,因而当应用于一般的音乐信号时,通常无法获得令人满意的结果。以下,将对提出将基于LPC的编码同感知音频编码结合于同一框架的概念予以说明,从而对针对一般的音频信号和语音信号来说均比较有效的统一音频编码予以说明。
一般而言,感知音频编码器使用基于滤波器组的方法有效地对音频信号进行编码,并根据掩蔽曲线的估计结果而对量化失真加以成形。
图16a示出了单声道感知编码系统的基本方框图。分析滤波器组1600用于将时域采样映射为经二次采样的频谱分量。根据频谱分量的个数,该系统还可称为子带编码器(子带数量较少,如32)或变换编码器(频率线数量较多,如512)。感知(“心理声学”)模型1602用于对取决于实际时间的掩蔽阈值进 行估计。对频谱(“子带”或“频域”)分量进行量化和编码1604,使得量化噪声隐没在实际发送信号之下,并使得在解码后无法觉察到量化噪声。这是通过改变频谱值在时间和频率上的量化精细度而实现的。
除了辅助信息以外,还把经量化和熵编码的频谱系数或子带值输入比特流格式化器1606,该比特流格式化器1606提供适于传送或存储的经编码的音频信号。方框1606的输出比特流可以通过互联网发送,也可以存储在任意的机器可读数据载体上。
在解码器端,解码器输入接口1610接收编码的比特流。方框1610将熵编码和量化的频谱/子带值同辅助信息分开。编码的频谱值输入诸如哈夫曼解码器的熵解码器,该解码器位于1610和1620之间。这个熵解码器的输出被量化为频谱值。这些量化的频谱值输入执行如图16a中1620处所示的“逆”量化的逆量化器。方框1620的输出被输入综合滤波器组1622,后者执行包括频率/时间变换以及通常情况下,诸如交叠与相加和/或合成边加窗(synthesis-sidewindowing)操作等的时域混叠消除操作的合成滤波,以最终获得输出音频信号。
图16b、16c示出了图16a的基于整个滤波器组的感知编码概念的替换物,其中实现了编码器端的预滤波方法以及解码器端的后滤波方法。
在[Ed100]中,提出了一种通过利用所谓的预滤波器而并非在频率上对频谱系数进行可变量化,把非相关缩减(即,根据感知标准进行噪声成形)和冗余缩减(即,获取数学意义上更加简洁的信息表示)的方面相分离的感知音频编码器。图16b示出了上述原理。感知模型1602对输入信号进行分析,计算频率上的掩蔽阈值曲线的估计结果。将掩蔽阈值转换为一组预滤波器系数,使得其频率响应的幅度同掩蔽阈值成反比。预滤波操作将这组系数施加于输入信号,从而产生输出信号,该输出信号中所有频率分量均根据其感知重要性予以表示(“感知白化”)。接着,用可以产生“白”量化失真的任意类型的音频编码器1632对该信号进行编码,即,不采用任何感知噪声成形。音频信号的传输/存储的内容包括:编码器的比特流以及预滤波系数的编码版本。在图16c的解码器1634中,将编码器比特流解码为含有加性白量化噪声的感知白化音频信号。然后,根据所发送的滤波器系数,对该信号执行后滤波操作。由于后置滤波器1640执行与预滤波器相反的逆滤波处理,因而能够根据感知白化信号重建原始音频输入信号。后置滤波器1640对加性量化白噪声进行频谱成形, 使之状如掩蔽曲线,从而如同预期的那样,在解码器输出端感觉上该噪声是有色的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880019699.9/2.html,转载请声明来源钻瓜专利网。