[发明专利]减小数目的声道解码有效

专利信息
申请号: 200680054051.6 申请日: 2006-08-18
公开(公告)号: CN101410890A 公开(公告)日: 2009-04-15
发明(设计)人: 拉斯·维尔默斯;克里斯托弗·薛林;耶罗恩·布里巴特 申请(专利权)人: 杜比瑞典公司;皇家飞利浦电子股份有限公司
主分类号: G10L19/00 分类号: G10L19/00;H04S3/00
代理公司: 中科专利商标代理有限责任公司 代理人: 王波波
地址: 瑞典斯*** 国省代码: 瑞典;SE
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 减小 目的 声道 解码
【说明书】:

技术领域

本发明涉及音频信号的解码,尤其是将原始多声道信号的参数多声道下混(downmix)解码为比原始多声道信号声道数目更小数目的声道。 

背景技术

近来的音频编码的发展具备了基于立体声(或单声道)信号和对应的控制数据来重建音频信号的多声道表示的能力。由于传送了附加控制数据以基于传送的单声道或立体声声道来控制环绕声道的重建,也称为上混(upmix),因此,这些方法本质上不同于如Dolby Prologic之类的以前的基于矩阵的解决方案。 

因此,这样的参数多声道音频解码器(例如MPEG环绕)基于M个传送声道和附加控制数据来重构N个声道,其中N>M。所述附加控制数据表现出比传送所有N个声道明显更低的数据速率,使编码非常有效率,同时确保与M声道设备以及N声道设备的兼容性。 

这样的参数环绕编码方法通常包括基于IID(声道间强度差)和ICC(声道间相干)的环绕信号的参数化。这些参数描述了上混过程中声道对之间的功率比和相关性。现有技术中也使用的参数还包括用于在上混过程中预测中间或输出声道的预测参数。 

这样的多声道编码的两个著名示例是BCC编码和MPEG环绕。在BCC编码中,使用基于DFT(离散傅立叶变换)的具有重叠窗口的变换,将多个音频输入声道转换为频谱表示。接着,将产生的均一的频谱分为不重叠的部分。每个部分的带宽与等效矩形带宽(ERB)成正比。接着,为每个部分估计被称为ICLD(声道间声级差)和ICTD(声道间时间差)的空间参数。ICLD参数描述了两个声道之间的声级差,而ICTD参数描述了不同声道的两个信号之间的时间差(相位偏移)。对于每个声道,相对于共同参考声道给出声级差和时间差。在获得这些参数之后,量化并编码这些参数以用于传送。 

在BCC编码中,相对于一个信号参考声道来估计各个参数。在其他参数环绕编码系统中,例如在MPEG环绕中,使用树形结构的参数化。这就是说,不再相对于单一共同参考声道,而是相对于不同的参考声道来估计参数,这些不同参考声道甚至可以是原始多声道信号的声道组合。例如,对于5.1声道信号,可以在前置声道的组合之间和后置声道的组合之间估计参数。 

当然,对于参数编码方案,也非常希望具有对已经建立的音频标准的后向兼容性。例如,对于单声道下混信号,希望也能提供一种可能性来创建具有高保真度的立体声回放信号。这意味着,必须以可能的最佳方式利用附加产生的参数,将单声道下混信号上混为立体声信号。 

由于人类对声源的空间位置的感知主要由信号的响度支配,即由信号中包含的能量支配,因此,多声道编码中的一个共同问题是上混中的能量保持。因此,在信号的再现中必须最大可能地考虑到为每个重构的声道加以合适的响度属性,以避免人工效应的引入严重降低了重构信号的感知质量。由于在下混过程中,信号的幅度通常被相加,带来了干扰的可能性,该可能性由相关性或相干参数来描述。 

当涉及减小数目的声道的重构(声道的数目小于多声道信号的原始声道数目)时,由于相对于相同的单个参考声道来传送每个参数,因此如BCC之类的方案容易处理。因此,有了参考声道的知识,可以容易地获得上混所需的每个声道的最相关的声级信息(绝对能量度量)。因此,不需要首先重构完整多声道信号就可以重构减小数目的声道。因此,在BCC中,通过使用单纯变量而不是变量的积,更容易对多声道信号的能量进行能量计算,但这只是第一步。当涉及得到减小数目的声道的能量和相关性,而所述减小数目的声道应当尽可能接近于原始多声道信号的部分下混时,MPEG环绕和BCC中的难度等级相当。

与此相反,如MPEG环绕之类的基于树形的结构使用了这样一种参数化,其中各声道的相关信息不包含在单个参数中。因此,在现有技术中,重构减小数目的声道要求重构多声道信号,接着将其下混为减小数目的声道,以不违反能量保持要求。这具有极高计算复杂度的明显缺点。 

国际专利申请WO 2005/101370 A1描述了一种特定方法,对数据进行多声道编码,将其编码为一个单声道和相关联的辅助信息,该辅助信息具有关于原始多声道信号的空间特性的信息。在传送下混声道和辅助信息时,适当的解码器能够重构作为产生该下混和参数的基础的原始多声道信号的近似。 

选择参数化,使得能够在不利用所传送的全部参数的情况下,重构原始声道的指定声道组合,因此,例如在只应重构5.1声道信号的前置声道(左、中心和右声道)时,可以减小重构的计算复杂度。 

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比瑞典公司;皇家飞利浦电子股份有限公司,未经杜比瑞典公司;皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200680054051.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top