[发明专利]根据下混的音频场景的重构有效
申请号: | 201480029538.3 | 申请日: | 2014-05-23 |
公开(公告)号: | CN105229731B | 公开(公告)日: | 2017-03-15 |
发明(设计)人: | T·赫冯恩;H·普恩哈根;L·J·萨米尔森;L·维尔莫斯 | 申请(专利权)人: | 杜比国际公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;H04S7/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 宋岩 |
地址: | 荷兰阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 根据 音频 场景 | ||
相关申请的交叉引用
本申请要求在2013年5月24日提交的美国临时专利申请第61/827,469号的优先权,其通过引用而被整体结合于此。
技术领域
在此公开的本发明一般地涉及音频的编码和解码领域。具体而言,其涉及对包括音频对象的音频场景的编码和解码。
本公开涉及题为“CodingofAudioScenes”并且将HeikoPurnhagen等人称为发明人的与本申请在相同日期提交的美国临时申请第61/827,246号。所引用的申请被包括在附录A中并且在此通过引用而被包括于此。
背景技术
存在用于参数空间音频编码的音频编码系统。例如,MPEG环绕描述了一种用于多通道音频的参数空间编码的系统。MPEGSAOC(空间音频对象编码)描述了一种用于音频对象的参数编码的系统。
在编码器侧,这些系统通常将通道/对象下混为通常是单通道(一个通道)或者立体声(两个通道)下混的下混,并且提取借助于比如层级差异和互相关的参数来描述通道/对象的属性的边信息。下混和边信息然后被编码并发送到解码器侧。在解码器侧,在边信息的参数的控制下根据下混来重构—即近似于(approximate)—通道/对象。
这些系统的缺点是重构通常在数学上是复杂的并且经常必须依赖于关于作为边信息发送的参数所未明确描述的音频内容的属性的假设。这种假设可以例如是:除非互相关参数被发送则通道/对象被看作不相关,或通道/对象的下混被以特定方式生成。
除了以上之外,编码效率在包括网络广播和一对一文件传输两者在内的旨在用于音频分发的应用中作为关键设计因素出现。为了至少在非专业产品中保持文件大小和所需存储器有限,编码效率也有一定相关度。
附图说明
在下文中,将参考附图来描述示例实施例,其上:
图1是接收具有多个音频对象的音频场景(可能还有声床通道(bedchannel))并且输出下混比特流和元数据比特流的音频编码系统的广义框图;
图2示出了用于重构声床通道的方法的细节;更具体地,其是示出不同信号部分的时间频率图,在这些信号部分中信号能量数据被计算以完成维纳型滤波;
图3是音频解码系统的广义框图,该音频解码系统基于下混比特流和元数据比特流来重构音频场景;
图4示出了配置为通过对象增益来编码音频对象的音频编码系统的细节;
图5示出了在考虑到编码失真的同时计算所述对象增益的音频编码系统的细节;
图6示出了下混通道声床通道和音频对象相对于参考收听点的示例虚拟位置;并且
图7示出了特别配置用于重构声床通道和音频对象的混合的音频解码系统。
所有的附图都是示意性的并且一般地示出用来阐明这里的主题的多个部分,而其他部分可以被省略或者仅仅建议。除非另有指示,相似的标号在不同附图中指代相似部分。
具体实施方式
如在这里使用的,音频信号可以指代纯音频信号、视频信号或者多媒体信号的音频部分或者复杂音频对象的音频信号部分,其中音频对象可以进一步包括位置或其他元数据或者可以与位置或其他元数据相关联。本公开一般地涉及用于从音频场景变换为编码该音频场景的比特流(编码)和反过来(解码或者重构)的方法和设备。变换通常与分发相结合,由此解码在比编码晚的时间点和/或在不同的空间位置和/或使用不同的装备而发生。在将被编码的音频场景中,存在至少一个音频对象。音频场景可以被认为分段为频带(例如,B=11个频带,其中的每个都包括多个频率样本)和时间帧(例如包括64个样本),由此一个时间帧的一个频带形成一个时间/频率片(tile)。若干时间帧,例如24个时间帧,可以构成一个超级帧。实现这种时间和频率分段的典型方式是通过加窗时间—频率分析(示例窗口长度:640个样本),包括众所周知的离散谐波变换。
I.概览—通过对象增益的编码
在第一方面内的示例实施例中,提供了用于编码音频场景由此获得比特流的方法。比特流可以被分为下混比特流和元数据比特流。在该示例实施例中,一个时间帧中的几个(或者全部)频带中的信号内容通过联合处理操作而被编码,其中来自一个处理步骤的中间结果在影响多于一个频带的后续步骤中被使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480029538.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有动态可变的线圈形状的感应线圈
- 下一篇:多识别器语音识别