[发明专利]用于处理多信道音频信号的方法、设备和计算机程序无效

申请号：	200980161903.5	申请日：	2009-10-12
公开（公告）号：	CN102576531A	公开（公告）日：	2012-07-11
发明（设计）人：	J·奥扬佩雷	申请（专利权）人：	诺基亚公司
主分类号：	G10L19/00	分类号：	G10L19/00;H04S3/00;G10L19/02
代理公司：	北京市中咨律师事务所 11247	代理人：	杨博;杨晓光
地址：	芬兰***	国省代码：	芬兰;FI
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于处理信道音频信号方法设备计算机程序
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及有关处理多信道音频信号的方法、设备和计算机程序。

背景技术

空间音频场景由音频源和环绕收听者的周围环境组成。空间音频场景的周围环境分量可以包括由房间效应导致的周围背景噪声，即，由于音频源所处的空间的属性导致的音频源的混响，和/或听觉空间内的一(多)个其他周围环境声音源。听觉意象由于来自音频源的声音到达的方向和混响而被感知。人能够使用来自左耳和右耳的信号捕获三维意象(image)。因此，使用置于接近耳鼓的麦克风来记录音频意象足以捕获空间音频意象。

在音频信号的立体声编码中，两个音频信号被编码。在很多情况下，音频信道至少部分时间可以具有相当相似的内容。因此，可以通过将信道一起编码来高效地执行音频信号的压缩。这导致了整体的比特率，其可以低于独立对信道进行编码所需的比特率。

通常使用的低比特率立体声编码方法已知为参数化立体声编码。在参数化立体声编码中，使用单声道编码器和立体声信号的参数化表示对立体声信号进行编码。参数化立体声编码器将单声道信号计算为输入信号的线性组合。输入信号的组合还可以称为下混频(downmix)信号。可以使用常规的单声道音频编码器对单声道信号进行编码。除了创建单声道信号并对其进行编码，编码器还提取立体声信号的参数化表示。参数可以包括关于电平差、相位(或时间)差和输入信道间的相干性的信息。在解码器侧，利用该参数化的信息从已解码单声道信号重新创建立体声信号。参数化立体声可以视为强化立体声编码的改进版本，其中仅提取信道间的电平差。

参数化立体声编码可以概括成任意数量的信道的多信道编码。在具有任意数量的输入信道的一般情况下，参数化编码过程提供具有信道数量比输入信号小的下混频信号，以及提供有关(例如)电平/相位差以和输入信道间的相关性的信息的参数化表示，以使得实现基于下混频信号的多信道信号的重构。

另一常见的尤其是用于较高比特率的立体声编码方法，是已知的中-侧立体声，其可以缩写为M/S立体声。中-侧立体声编码将左信道和右信道转换成中间信道和侧信道。中间信道是左信道和右信道之和，而侧信道则是左信道和右信道的差。这两个信道被独立地编码。在足够准确的量化的情况下，中-侧立体声相对良好地保留了原始音频意象而没有引入严重的伪像(artifact)。另一方面，对于高质量再现的音频，所需的比特率仍旧处于相当高的电平。

像参数化编码那样，M/S编码也可以从立体声编码概括为对任意数量的信道的多信道编码。在多信道的情况下，典型地对信道对执行M/S编码。例如，在5.1信道配置中，前左信道和前右信道可形成第一对并使用M/S方案来编码，而后左信道和后右信道可形成第二对并且也使用M/S方案来编码。

存在得益于高效多信道音频处理和编码能力的多个应用，例如“环绕声音”利用5.1或7.1信道格式。得益于高效多信道音频处理和编码的另一示例是多视图音频处理系统，其可以包括例如多视图音频捕获、分析、编码、解码/重构和/或呈现组件。在多视图音频处理系统中，例如从多个空间接近的麦克风获取的信号被用来捕获捕获音频场景，其中，所有麦克风都相对于正向轴指向不同的角度。所捕获的信号可能被处理并被发送(或者可替代地，被存储以用于以后的消费)到呈现侧，端用户在该呈现侧可基于他/她的偏好从多视图音频场景选择听觉视图。呈现部分于是根据与所选听觉视图对应的多视图音频场景提供一(多)个经过下混频的信号。为了使得能够实现通过网络的传输或存储媒介中的存储，可能需要应用压缩方案来满足网络或存储空间需求的限制。

与多视图音频场景相关联的数据速率经常如此的高，以致于可能需要对信号进行压缩编码和相关的处理，以便使得能够实现通过网络的传输或存储。此外，有关所需传输带宽的类似挑战本质上对于任何多信道音频信号仍然有效。

通常，多信道音频是多视图音频的子集。在某种意义上，多信道音频编码解决方案可以应用到多视图音频场景，尽管它们对于诸如两信道立体声或5.1或7.1信道格式的标准扬声器布置的编码是更加优化的。

例如，已经提出了以下多信道音频编码方案。高级音频编码(AAC)标准定义了信道成对的编码类型，其中，输入信道被分成信道对，并且将高效的心理声学引导编码应用到每一个信道对。该编码类型更多地面向高比特率编码。通常，心理声学引导编码关注于保持量化噪声低于掩蔽阈值，即，人耳听不见。这些模型即使在单信道信号的情况下也典型地在计算上十分复杂，更不必说具有相对多数目的输入信道的多信道信号了。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于诺基亚公司，未经诺基亚公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200980161903.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于处理多信道音频信号的方法、设备和计算机程序无效

专利文献下载