[发明专利]用于在空间音频对象编码中适配音频信息的设备和方法有效
申请号: | 201380042080.0 | 申请日: | 2013-06-28 |
公开(公告)号: | CN104704557B | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 托尔斯滕·卡斯特纳;于尔根·赫勒;莱昂·特伦提夫;奥利弗·赫尔穆特;约尼·保卢斯;法尔科·里德布施 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/16 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 唐京桥,李春晖 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 空间 音频 对象 编码 配音 信息 设备 方法 | ||
技术领域
本发明涉及音频信号解码和音频信号处理,更具体地,涉及用于在空间音频对象编码(SAOC)中将音频信息进行适配的解码器和方法。
背景技术
US2011200197A1提供了一种能够有效地处理基于对象的音频信号的音频解码方法和装置以及音频编码方法和装置。音频解码方法包括:接收缩混信号和基于对象的辅助信息,所述缩混信号包括至少两个缩混声道信号;从所述基于对象的辅助信息提取增益信息,并且基于所述增益信息生成基于声道对声道修改所述缩混声道信号的修改信息;以及通过将所述修改信息应用于缩混声道信号来修改所述缩混声道信号。
在现代数字音频系统中,允许在接收方侧对所传输的内容进行与音频对象相关的修改是主要趋势。这些修改包括对在经由空间分布的扬声器进行多声道回放的情况下对专用音频对象的空间重定位和/或音频信号的所选择的部分的增益修改。这可以通过单独地将音频内容的不同部分递送到不同的扬声器来实现。
换言之,在音频处理、音频传输以及音频存储领域中,越来越期望允许对面向对象的音频内容回放进行用户交互,并且还需要利用多声道回放的扩展的可能性以单独地呈现音频内容或者部分音频内容,以便改进听觉感受。由此,多声道音频内容的使用为用户带来显著的改进。例如,可以获得三维听觉感受,这在娱乐应用中带来改进的用户满意度。然而,多声道音频内容在专业环境中例如电话会议应用中也是有用的,因为可以通过使用多声道音频回放来改进讲话者清晰度。另一可能的应用是给音乐作品的听者提供不同部分(也称为“音频对象”)或音轨如人声部分或者不同乐器的单独调整回放级别和/或空间位置。用户可以为了个人品味、为了从音乐作品中更容易地改编一个或更多个部分、为了教学目的、卡拉OK、排练等原因而进行这种调整。
对如以脉冲编码调制(PCM)数据或者甚至是压缩音频格式的形式的全数字多声道或多对象音频内容的直接的分离传输要求非常高的比特率。然而,以高比特率效率的方式来传输和存储音频数据也是理想的。因此,为了避免由多声道/多对象应用导致的过度资源负荷,人们乐于在音频质量与比特率要求之间接受合理的折衷。
近来,在音频编码领域中,由如运动图像专家组(MPEG)等提出了用于对多声道/多对象音频信号的比特率效率的传输/存储的参数化技术。一个示例是作为面向声道的方法[MPS、BCC]的MPEG环绕声(MPS),或者作为面向对象的方法[JSC、SAOC、SAOC1、SAOC2]的MPEG空间音频对象编码(SAOC)。另一种面向对象的方法称为“通知源分离”[ISS1、ISS2、ISS3、ISS4、ISS5、ISS6]。这些技术旨在音频场景中基于对声道/对象以及附加的辅助信息的缩混来重现期望的输出音频场景或者期望的音频源对象,其中辅助信息描述所传输的/存储的音频场景和/或音频源对象。
对这样的系统中的与声道/对象相关的辅助信息的估计和应用以时间-频率选择方式来完成。因此,这样的系统采用时间-频率变换如离散傅里叶变换(DFT)、短时傅里叶变换(STFT)或者滤波器组如正交镜像滤波器(QMF)组等。在图3中,使用MPEG SAOC为例来描绘这样的系统的基本原理。
在STFT的情况下,时间维度由时间块编号来表示,而频谱维度由频谱系数(“格子(bin)”)的编号来获得。在QMF的情况下,时间维度由时隙编号来表示,而频谱维度由子频带编号来获得。如果QMF的频谱分辨率由随后应用第二滤波器阶段来改进,则整个滤波器组称为混合QMF,并且高分辨率子频带称为混合子频带。
如上所述,如图3所示,在SAOC中,通常以时间-频率选择方式来进行处理,并且在每个频带内可以被描述如下:
-使用由元素d1,1…dN,P构成的缩混矩阵将N个输入音频对象信号s1…sN混缩成P个声道x1…xP以作为编码器处理的一部分,另外,编码器对描述输入音频对象的特性的辅助信息(辅助信息估计器(SIE)模块)进行提取。对于MPEG SAOC,关于彼此的对象能量的关系是这种辅助信息的最基本的形式。
-一个或更多个缩混信号和辅助信息被传输/存储。为此,可以如使用众所周知的感知音频编码器如MPEG-l/2Layer II或者III(aka.mp3)、MPEG-2/4增强音频编码(AAC)等来将一个或更多个缩混音频信号进行压缩。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380042080.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于机动车辆的照明装置和相关的组装方法
- 下一篇:一种太阳能路灯