[发明专利]用于改善对多声道音频信号的呈现的方法和设备有效
申请号: | 201380038438.2 | 申请日: | 2013-07-19 |
公开(公告)号: | CN104471641B | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 奥利弗·威伯特;约翰内斯·伯姆;彼得·杰克斯 | 申请(专利权)人: | 杜比国际公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 程连贞 |
地址: | 荷兰阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 改善 多声道 音频 信号 呈现 方法 设备 | ||
技术领域
本发明的领域为音频压缩,具体地多声道音频信号和以声场为导向的音频场景的压缩,例如高阶立体声(HOA)。
背景技术
目前,多声道音频信号的压缩方案不能明确地考虑输入的音频材料是如何制作或混合的。因此,已知的音频压缩技术无法获知他们将进行压缩的内容的原始/混合类型。在已知方法中,执行“盲”信号变换,通过所述变换将多声道信号分解为随后进行量化和编码的信号分量。这种方法的缺点在于对上述信号分解的计算是要求计算能力的,针对给定片段的音频场景,寻找最适合的和最有效的信号分解是困难的并且易于出错。
发明内容
本发明涉及一种用于改善多声道音频呈现的方法和设备。
发现至少一部分上述缺点是由于缺少关于场景组成的特性的先验知识而导致的。尤其对于空间音频内容(例如,多声道音频或高阶立体声(HOA)内容),这种现有信息有助于采用压缩方案。例如,压缩算法中的通用预处理步骤是音频场景分析,目的是从原始内容或原始内容混合中提取定向的音频源或音频对象。可以与残余空间音频分量分离地对这种定向的音频源或音频对象进行编码。
在一个实施例中,用于对预处理的音频数据进行编码的方法包括以下步骤:对预处理的音频数据进行编码;以及对辅助数据进行编码,所述辅助数据表示对音频数据的特定音频进行预处理。
在一个实施例中,本发明涉及一种用于对编码的音频数据进行解码的方法,包括以下步骤:确定在编码之前是否已经对音频数据进行预处理;对音频数据进行解码;从接收到的数据提取与预处理有关的信息;以及根据所提取的预处理信息,对解码的音频数据进行后处理。可以通过分析音频数据或通过分析伴随的元数据,来实现所述确定在编码之前是否已经对音频数据进行预处理的步骤。
在本发明的一个实施例中,用于对预处理的音频数据进行编码的编码器包括:第一编码器,用于对预处理的音频数据进行编码;以及第二编码器,用于对辅助数据进行编码,所述辅助数据表示对音频数据的特定音频进行预处理。
在本发明的一个实施例中,用于对编码的音频数据进行解码的解码器包括:分析器,用于确定在编码之前是否已经对音频数据进行预处理;第一解码器,用于对所述音频数据进行解码;数据流解析单元或数据流提取单元,用于从接收到的数据提取与预处理有关的信息;以及处理单元,用于根据所提取的预处理信息对解码的音频数据进行后处理。
在本发明的一个实施例中,计算机可读介质将可执行指令存储在其上,以便引起计算机执行根据上述方法中的至少一个的方法。
本发明的总体构思是基于对多声道音频压缩系统的以下扩展中的至少一个的:
根据一个实施例,多声道音频压缩和/或呈现系统具有接口,所述接口包括多声道音频信号流(例如,PCM流)、声道或相应扬声器的相关空间位置以及表示向多声道音频信号流施加的混合的类型的元数据。混合类型表示例如(在先)使用或配置和/或HOA或VBAP平移的任何详情、特定记录技术或等同信息。所述接口可以是信号传输链的输入接口。在HOA内容的情况下,扬声器的空间位置可以是虚拟扬声器的位置。
根据一个实施例,多声道压缩编解码器的比特流包括信令信息和后续的呈现算法,所述信令信息向解码器传输与虚拟或实际扬声器位置和原始混合信息有关的上述元数据。从而,可以调整任何施加在解码侧上的任何呈现技术,以便适应所述具体传输内容的编码侧上的特定混合特性。
在一个实施例中,元数据的使用是可选的并且是可以接通或关断的。即,可以按照不使用元数据的简单模式来解码和呈现音频内容,但是在所述简单模式下,所述解码和/或呈现不是优化的。在增强模式下,可以通过使用元数据实现优化的解码和/或呈现。在该示例中,解码器/呈现器可以在两个模式之间切换。
附图说明
参考附图描述了本发明的有利示例实施例,附图中:
图1是已知多声道传输系统的结构;
图2是根据本发明的一个实施例的多声道传输系统的结构;
图3是根据本发明的一个实施例的智能解码器;
图4是针对HOA信号的多声道传输系统的结构;
图5是DSHT的空间采样点;
图6是针对在编码器和解码器结构框中使用的码本的球面采样位置的示例;以及
图7是特别改善的多声道音频编码器的示例实施例。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380038438.2/2.html,转载请声明来源钻瓜专利网。