[发明专利]用于使用基于对象的元数据产生音频输出信号的装置和方法有效

专利信息
申请号: 201310228584.3 申请日: 2009-07-06
公开(公告)号: CN103354630A 公开(公告)日: 2013-10-16
发明(设计)人: 斯蒂芬·施赖纳;沃尔夫冈·菲泽尔;马蒂亚斯·诺伊辛格;奥立夫·赫尔穆特;拉尔夫·斯皮尔施内德 申请(专利权)人: 弗朗霍夫应用科学研究促进协会
主分类号: H04S3/00 分类号: H04S3/00
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 宋融冰
地址: 德国*** 国省代码: 德国;DE
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 使用 基于 对象 数据 产生 音频 输出 信号 装置 方法
【说明书】:

本申请是申请人为弗朗霍夫应用科学研究促进协会、申请日为2011年1月17日、申请号为200980127935.3、发明名称为“用于使用基于对象的元数据产生音频输出信号的装置和方法”的分案申请。

技术领域

本发明涉及音频处理,具体而言,涉及在诸如空间音频对象编码的音频对象编码方面的音频处理。

背景技术

在现今的广播系统例如电视机中,在某些情况下,希望不要如同录音师所设计的那样再现音轨,而希望是执行特殊调整,以解决在演示时所给予的约束。一种广为人知的控制此种后期制作调整的技术,是提供伴随着那些音轨的适当元数据。

传统的还音系统,如老式家用电视系统,系由一个扬声器或一对立体扬声器所组成。更先进的多声道再现系统使用五个或者甚至更多个扬声器。

若考虑的是多声道再现系统,那么录音师可更灵活地在二维平面上放置数个单音源,并因此亦可针对其所有的音轨而使用较高的动态范围,因为由于公知的鸡尾酒会效应(cocktail party effect)实现语音清晰度容易得多。

然而,那些保真的、高动态的音频可能会导致在传统再现系统上的问题。可能会有这样的情景出现:顾客可能会不想要这种高动态信号,因为她或他是在吵闹的环境中(如开车时或是在飞机上,或是使用移动娱乐系统)聆听这些内容,她或他正戴着助听器,或是她或他并不想要打扰她或他的邻居(例如在深夜的时候)。

此外,广播公司面临这样的问题,那就是,由于连续项目的调整位准需要不同波峰因数,因而在一个节目中的不同项目(如商业广告)可能会位于不同的音量位准。

在传统的广播传输链中,终端用户接收已混音轨。在接收者方的任何更进一步的操作,都可能只以非常受限的形式完成。目前杜比元数据的小特征集(feature set)允许使用者修改音频信号的一些特性。

一般而言,根据上文所提过的元数据的操作,是在没有任何频率选择性区别的情况下应用的,因为传统上隶属于音频信号的元数据并未提供足够的信息来这么做。

此外,只有完整的音频流本身才可被操作。另外,也没有任何方法用于在此音频流中采纳并分割各个音频对象。特别是在不适当的聆听环境中,这可能会令人不满。

在午夜模式中,因为失去了导引信息,所以现存的音频处理器不可能区分环境噪声与对话。因此,在高位准噪声(其必须在音量上被压缩或限制)的情况中,对话也将会被平行地操作。这可能会损害语音清晰度。

相对于环境声音而增加对话位准,有助于增进对语音的感知,特别是对于听力障碍者。这样的技术只在当音频信号额外配合特性控制信息,而在对话与环境分量真正分离时,才能发挥作用。若只有立体声降混信号是可用的,那么就再也不能施加进一步的分离以分别区分和操作语音信息。

目前的降混解决办法允许针对中央与环绕声道的动态立体声位准调整。但针对取代立体声音响的任何变型的扬声器配置,并没有来自发送器的如何降混最终多声道音频源的真正描述。只有解码器中的默认公式以非常不灵活的方式执行信号混合。

在所有描述的方案中,通常会存在着两种不同的途径。第一个途径是,当产生要发送的音频信号时,将一组音频对象降混进单声道、立体声、或是多声道信号中。要经由广播、任何其它传输协议、或在计算机可读储存介质上发布而发送给用户此信号的的这个信号,一般会具有小于原始音频对象数目的声道数,这些原始音频对象被音响师在例如工作室环境中降混。此外,可附加元数据,以允许数种不同的修改,但这些修改只可应用在完整的发送信号上,或者是,若所发送的信号具有数个不同的发送声道时,整体地应用在独立的一些发送声道上。然而,由于这些发送声道总是数个音频对象的叠加,因而在其他音频对象未被操作的情况下,对于特定音频对象的独立操作是完全不可能的。

另一个途径是不执行对象降混,而在其作为分离的发送声道时发送音频对象信号。如果音频对象的数目很小,则这样的方案可很好地发挥作用。例如当只存在五个音频对象时,就有可能在5.1方案中彼此分离地发送这五个相异的音频对象。元数据可与这些声道相关联,其指出对象/声道的专有性质。然后,在接收器侧,能够基于所发送的元数据来操作这些所发送的声道。

此途径的缺点是,其并非反向兼容的,且只在小量音频对象的情况中运作良好。当音频对象的数目增加时,作为分离的明确音轨发送所有对象的所需比特率急剧上升。此上升的比特率在广播应用的情况中是特别不适宜的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗朗霍夫应用科学研究促进协会,未经弗朗霍夫应用科学研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310228584.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top