[发明专利]自适应量化有效

申请号：	201780008056.3	申请日：	2017-01-26
公开（公告）号：	CN108496221B	公开（公告）日：	2020-01-21
发明（设计）人：	N·R·茨恩高斯;Z·G·科恩;V·库玛	申请（专利权）人：	杜比实验室特许公司
主分类号：	G10L19/002	分类号：	G10L19/002;G10L19/00;H03M1/00
代理公司：	11038 中国国际贸易促进委员会专利商标事务所	代理人：	宿小猛
地址：	美国加***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频对象重要性度量总噪声度量能量度量总能量量化自适应量化量化误差总信噪比信噪比求和应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

可以对多个接收的音频对象中的每个音频对象确定重要性度量，该重要性度量至少部分地基于能量度量。一些方法可以包含：至少部分地基于通过对音频对象中的每个音频对象的能量度量进行求和而计算的总能量值来对音频对象中的所有音频对象确定总体重要性度量；对音频对象中的每个音频对象确定估计的量化位深和量化误差；对音频对象中的所有音频对象计算总噪声度量，总噪声度量至少部分地基于与估计的量化位深相对应的总量化误差；计算与总噪声度量和总能量值相对应的总信噪比；并且通过将信噪比阈值应用于总信噪比来对音频对象中的每个音频对象确定最终量化位深。

相关申请的交叉引用

本申请要求2016年1月26日提交的美国临时专利申请No.62/287,348和2016年1月26日提交的欧洲专利申请No.16152783.3的优先权权益，这些申请特此通过引用并入。

技术领域

本公开涉及音频数据处理。具体地说，本公开涉及音频数据的高效编码。

背景技术

自从1927年为影片引入声音以来，用于捕获运动图片声轨的艺术意图并且在电影院环境中重放该声轨的技术一直稳定地发展。在二十世纪三十年代，盘上的同步声音让位于影片上的可变区域声音，影片上的可变区域声音随着多轨录音和可操纵重放(通过使用控制音调来移动声音)的早期引入而在二十世纪四十年代通过剧场声学考虑和改进的扩音器设计得到进一步的改进。在二十世纪五十年代和二十世纪六十年代，影片的涂磁道使得可以在剧院里进行多声道回放，从而在高级剧院里引入环绕声道和多达五个屏幕声道。

在二十世纪七十年代，Dolby在后期制作中和影片上两者引入了降噪、以及对具有3个屏幕声道和单个环绕声道的混音进行编码和分发的成本有效的手段。影院声音的质量在二十世纪八十年代通过Dolby频谱录音(SR)降噪和认证程序(诸如THX)得到进一步的改进。Dolby在二十世纪九十年代期间通过5.1声道格式将数字声音带入影院，该5.1声道格式提供离散的左屏幕声道、中心屏幕声道和右屏幕声道、左环绕阵列和右环绕阵列、以及用于低频效果的低音炮声道。2010年引入的Dolby Surround 7.1通过将现有的左环绕声道和右环绕声道划分为四个“区”而使环绕声道的数量增加。

因为声道的数量增加并且扩音器布局从平面二维(2D)阵列转变为包括高度扬声器的三维(3D)阵列，所以创作和渲染声音的任务变得越来越复杂。在一些情况下，提高的复杂度已经涉及需要被存储和/或流传输的音频数据的量的相当大的增加。改进的方法和设备将是期望的。

发明内容

本公开中描述的主题的一些方面涉及不参照任何特定的再现环境而创建的包括音频对象的音频数据。如本文所使用的，术语“音频对象”可以是指音频信号和相关联的音频对象元数据的流。元数据可以至少指示音频对象的位置。但是，在一些例子中，元数据还可以指示去相关数据、渲染约束数据、内容类型数据(例如，对话、效果等)、增益数据、轨迹数据等。一些音频对象可以是静态的，而其他音频对象可以具有时变的元数据：这样的音频对象可以移动，可以改变大小，和/或可以具有随着时间而改变的其他性质。

当在再现环境中监视或回放音频对象时，可以至少根据音频对象位置数据来渲染音频对象。渲染处理可以包含对输出声道的集合中的每个声道计算音频对象增益值的集合。每个输出声道可以对应于再现环境的一个或多个再现扬声器。因此，渲染处理可以包含至少部分地基于音频对象元数据来将音频对象渲染到一个或多个扬声器馈送信号中。扬声器馈送信号可以对应于再现环境内的再现扬声器定位。

如本文详细地描述的，在一些实现中，一种方法可以包含接收包括多个音频对象的音频数据。音频对象可以包括音频信号和相关联的音频对象元数据。在一些例子中，多个音频对象可以对应于音频数据的单个帧。可以对音频对象中的每个音频对象确定重要性度量，该重要性度量可以至少部分地基于能量度量。在一些实现中，能量度量可以是与根据频率变化的人类听力灵敏度相对应的感知能量度量。一些例子可以包含根据每个音频对象的能量度量来对音频对象进行排序(sort)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司，未经杜比实验室特许公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201780008056.3/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]自适应量化有效

专利文献下载