[发明专利]用于处理多信道音频信号的方法、设备和计算机程序无效

专利信息
申请号: 200980161903.5 申请日: 2009-10-12
公开(公告)号: CN102576531A 公开(公告)日: 2012-07-11
发明(设计)人: J·奥扬佩雷 申请(专利权)人: 诺基亚公司
主分类号: G10L19/00 分类号: G10L19/00;H04S3/00;G10L19/02
代理公司: 北京市中咨律师事务所 11247 代理人: 杨博;杨晓光
地址: 芬兰*** 国省代码: 芬兰;FI
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 处理 信道 音频 信号 方法 设备 计算机 程序
【说明书】:

技术领域

发明涉及有关处理多信道音频信号的方法、设备和计算机程序。

背景技术

空间音频场景由音频源和环绕收听者的周围环境组成。空间音频场景的周围环境分量可以包括由房间效应导致的周围背景噪声,即,由于音频源所处的空间的属性导致的音频源的混响,和/或听觉空间内的一(多)个其他周围环境声音源。听觉意象由于来自音频源的声音到达的方向和混响而被感知。人能够使用来自左耳和右耳的信号捕获三维意象(image)。因此,使用置于接近耳鼓的麦克风来记录音频意象足以捕获空间音频意象。

在音频信号的立体声编码中,两个音频信号被编码。在很多情况下,音频信道至少部分时间可以具有相当相似的内容。因此,可以通过将信道一起编码来高效地执行音频信号的压缩。这导致了整体的比特率,其可以低于独立对信道进行编码所需的比特率。

通常使用的低比特率立体声编码方法已知为参数化立体声编码。在参数化立体声编码中,使用单声道编码器和立体声信号的参数化表示对立体声信号进行编码。参数化立体声编码器将单声道信号计算为输入信号的线性组合。输入信号的组合还可以称为下混频(downmix)信号。可以使用常规的单声道音频编码器对单声道信号进行编码。除了创建单声道信号并对其进行编码,编码器还提取立体声信号的参数化表示。参数可以包括关于电平差、相位(或时间)差和输入信道间的相干性的信息。在解码器侧,利用该参数化的信息从已解码单声道信号重新创建立体声信号。参数化立体声可以视为强化立体声编码的改进版本,其中仅提取信道间的电平差。

参数化立体声编码可以概括成任意数量的信道的多信道编码。在具有任意数量的输入信道的一般情况下,参数化编码过程提供具有信道数量比输入信号小的下混频信号,以及提供有关(例如)电平/相位差以和输入信道间的相关性的信息的参数化表示,以使得实现基于下混频信号的多信道信号的重构。

另一常见的尤其是用于较高比特率的立体声编码方法,是已知的中-侧立体声,其可以缩写为M/S立体声。中-侧立体声编码将左信道和右信道转换成中间信道和侧信道。中间信道是左信道和右信道之和,而侧信道则是左信道和右信道的差。这两个信道被独立地编码。在足够准确的量化的情况下,中-侧立体声相对良好地保留了原始音频意象而没有引入严重的伪像(artifact)。另一方面,对于高质量再现的音频,所需的比特率仍旧处于相当高的电平。

像参数化编码那样,M/S编码也可以从立体声编码概括为对任意数量的信道的多信道编码。在多信道的情况下,典型地对信道对执行M/S编码。例如,在5.1信道配置中,前左信道和前右信道可形成第一对并使用M/S方案来编码,而后左信道和后右信道可形成第二对并且也使用M/S方案来编码。

存在得益于高效多信道音频处理和编码能力的多个应用,例如“环绕声音”利用5.1或7.1信道格式。得益于高效多信道音频处理和编码的另一示例是多视图音频处理系统,其可以包括例如多视图音频捕获、分析、编码、解码/重构和/或呈现组件。在多视图音频处理系统中,例如从多个空间接近的麦克风获取的信号被用来捕获捕获音频场景,其中,所有麦克风都相对于正向轴指向不同的角度。所捕获的信号可能被处理并被发送(或者可替代地,被存储以用于以后的消费)到呈现侧,端用户在该呈现侧可基于他/她的偏好从多视图音频场景选择听觉视图。呈现部分于是根据与所选听觉视图对应的多视图音频场景提供一(多)个经过下混频的信号。为了使得能够实现通过网络的传输或存储媒介中的存储,可能需要应用压缩方案来满足网络或存储空间需求的限制。

与多视图音频场景相关联的数据速率经常如此的高,以致于可能需要对信号进行压缩编码和相关的处理,以便使得能够实现通过网络的传输或存储。此外,有关所需传输带宽的类似挑战本质上对于任何多信道音频信号仍然有效。

通常,多信道音频是多视图音频的子集。在某种意义上,多信道音频编码解决方案可以应用到多视图音频场景,尽管它们对于诸如两信道立体声或5.1或7.1信道格式的标准扬声器布置的编码是更加优化的。

例如,已经提出了以下多信道音频编码方案。高级音频编码(AAC)标准定义了信道成对的编码类型,其中,输入信道被分成信道对,并且将高效的心理声学引导编码应用到每一个信道对。该编码类型更多地面向高比特率编码。通常,心理声学引导编码关注于保持量化噪声低于掩蔽阈值,即,人耳听不见。这些模型即使在单信道信号的情况下也典型地在计算上十分复杂,更不必说具有相对多数目的输入信道的多信道信号了。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200980161903.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top