[发明专利]多声道音频编码和/或解码中改进的滤波器平滑有效
| 申请号: | 200680005651.3 | 申请日: | 2006-02-22 |
| 公开(公告)号: | CN101128867A | 公开(公告)日: | 2008-02-20 |
| 发明(设计)人: | A·塔勒布;S·安德森 | 申请(专利权)人: | 艾利森电话股份有限公司 |
| 主分类号: | G10L19/00 | 分类号: | G10L19/00;H04B1/66 |
| 代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 曾祥夌;张志醒 |
| 地址: | 瑞典斯*** | 国省代码: | 瑞典;SE |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多声道 音频 编码 解码 改进 滤波器 平滑 | ||
技术领域
一般来说,本发明涉及音频编码和解码技术,更具体来说,涉及多声道音频编码/解码、如立体声编码/解码。
背景技术
对于在保持高音频质量的同时以低比特率发送和存储音频信号存在极大的市场需要。具体来说,在传送资源或存储装置受到限制的情况中,低比特率操作是主要的成本因素。例如,在诸如GSM、UMTS或CDMA之类的移动通信系统的流播和消息传递应用中,情况通常是这样。
采用多声道编码和解码的音频传送系统的一般实例如图1示意说明。整个系统主要包括发送侧的多声道音频编码器100和传送模块10以及接收侧的接收模块20和多声道音频解码器200。
音频信号的立体声或多声道编码的最简单方式是把不同声道的信号分别编码为各个独立信号,如图2所示。但是,这意味着,不删除多个声道之间的冗余度,以及比特率要求将与声道的数量成正比。
立体声FM无线电传送中使用的并且确保与遗留单声道无线电接收器的兼容性的另一种基本方式是发送两个有关声道的和及差信号。
现有技术的音频编解码器、如MPEG-1/2第III层和MPEG-2/4AAC利用所谓的联合立体声编码。根据这种技术,不同声道的信号被联合处理而不是单独和分别处理。两种最常用的联合立体声编码技术称作‘中/侧’(M/S)立体声和强度立体声编码,它们通常应用于待编码的立体声或多声道信号的子带。
在对声道子带的和及差信号进行编码和发送、由此利用声道子带之间的冗余度的意义上,M/S立体声编码与立体声FM无线电中的所述程序相似。例如在参考文献[1]中描述了基于M/S立体声编码的编码器的结构和操作。
另一方面,强度立体声能够利用立体声不相干性。它发送(不同子带的)声道的联合强度以及某个位置信息,表明如何在声道之中分布强度。强度立体声仅提供声道的频谱幅度信息,而相位信息则没有传送。为了这个原因以及由于声道间时间信息(更具体来说是声道间时间差)特别在较低频率上具有主要心理声学相干性,所以强度立体声仅可在高于例如2kHz的高频上使用。例如在参考文献[2]中描述了强度立体声编码方法。
在参考文献[3]中描述了称作双耳线索编码(BCC)的最近发展的立体声编码方法。这种方法是参数多声道音频编码方法。这种参数编码技术的基本原理在于,在编码侧,来自N个声道的输入信号组合为一个单声道信号。单声道信号是采用任何传统单声道音频编解码器进行编码的音频。参数并行地从描述多声道图像的声道信号中得出。参数被编码以及与音频比特流一起发送给解码器。解码器首先对单声道信号解码,然后根据多声道图像的参数描述重新生成声道信号。
双耳线索编码(BCC)方法的原理在于,它发送编码单声道信号和所谓的BCC参数。BCC参数包括原始多声道输入信号的子带的已编码声道间电平差和声道间时间差。解码器通过根据BCC参数施加单声道信号的逐个子带的电平和相位和/或延迟调节,重新生成不同的声道信号。优于例如M/S或强度立体声的优点在于,包含声道间时间信息的立体声信息以低得多的比特率传送。但是,BCC在计算上要求高,并且一般在感知上没有优化。
参考文献[4]中描述的另一种技术采用单声道信号和所谓的侧信息的编码的相同原理。在这种情况中,侧信息由预测器滤波器和可选的残留信号组成。通过LMS算法估算的预测器滤波器在应用于单声道信号时,允许多声道音频信号的预测。通过这种技术,能够达到多声道音频源的极低比特率编码、但是以质量下降为代价。
这种参数立体声编码的基本原理如图3所示,它显示立体声编解码器的布局,其中包括混音模块120、核心单声道编解码器130、230和参数立体声侧信息编码器/解码器140、240。混音把多声道(在这种情况中为立体声)信号变换为单声道信号。参数立体声编解码器的目的是在给定重构的单声道信号和附加立体声参数的情况下在解码器上再生立体声信号。
为了完整性,将提到在3D音频中使用的一种技术。这种技术通过采用所谓的头相关滤波器对声源信号进行滤波来合成右和左声道信号。但是,这种技术要求不同的声源信号被分离,因而一般不可应用于立体声或多声道编码。
连续帧之间的滤波器特性的迅速变化造成重构立体声图像中的干扰混叠伪像和不稳定。为了克服这个问题,已经引入滤波器平滑。但是,传统的滤波器平滑一般导致相当大的性能降低,因为滤波器系数对于当前帧不再是最佳的。具体来说,传统的滤波器平滑一般导致立体声图像宽度的整体减小。
因此,一般需要多声道编码和/或解码过程中改进的滤波器平滑。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾利森电话股份有限公司,未经艾利森电话股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680005651.3/2.html,转载请声明来源钻瓜专利网。





