[发明专利]用于生成和渲染具有条件渲染元数据的基于对象的音频的方法和系统有效
申请号: | 201480019912.1 | 申请日: | 2014-04-03 |
公开(公告)号: | CN105075295B | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | S·S·麦塔;T·齐埃格勒;S·默里 | 申请(专利权)人: | 杜比实验室特许公司;杜比国际公司 |
主分类号: | H04S7/00 | 分类号: | H04S7/00;G10L19/008 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 欧阳帆 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 渲染 具有 条件 数据 基于 对象 音频 方法 系统 | ||
对相关申请的交叉引用
本申请要求2013年4月3日提交的美国临时专利申请No.61/807922和2013年6月7日提交的美国临时专利申请No.61/832397的申请日权益。
技术领域
本发明涉及音频信号处理,并且更特别地,涉及包括音频内容(指示至少一个扬声器声道和至少一个音频对象声道)和支持以依赖于回放有事情配置的方式对音频内容的条件渲染(conditional rendering)的元数据的音频数据比特流的编码、解码和交互式渲染。本发明的一些实施例以被称为杜比数字(Dolby Digital,AC-3)、杜比数字加(Dolby Digital Plus,增强版AC-3或E-AC-3)或者杜比E(Dolby E)的格式之一来生成、解码和/或渲染音频数据。
背景技术
杜比、杜比数字、杜比数字加以及杜比E是杜比实验室授权许可公司(Dolby Laboratories Licensing Corporation)的商标。杜比实验室提供分别被称为杜比数字和杜比数字加的AC-3和E-AC-3的专有实现。
尽管本发明不限于在根据E-AC-3(或者AC-3或杜比E)格式对音频数据进行编码时或者在传送、解码或渲染E-AC-3、AC-3或杜比E编码数据时使用,但是为了方便,在实施例中将描述本发明根据E-AC-3、AC-3或杜比E格式对音频比特流进行编码并且传送、解码和渲染这种比特流
典型的音频数据流包括音频内容(例如,音频内容的一个或更多个声道)和指示音频内容的至少一个特性的元数据。例如,在AC-3比特流中,存在若干个专用于改变被传送给收听环境的节目的声音的音频元数据参数。
AC-3或E-AC-3编码比特流包括元数据,并且可以包括1至6个声道的音频内容。音频内容是已经利用感知音频编码压缩的音频数据。AC-3(也称为杜比数字)编码的细节是众所周知的,并且在许多公开文献中得到阐述,公开文献包括:
ATSC标准A52/A:Digital Audio Compression Standard(AC-3),修订版A,先进电视系统委员会,2001年8月20日;及
美国专利5583962、5632005、5633981、5727119以及6021386
杜比数字加(E-AC-3)编码的细节例如在下文中得到阐述:“Introduction to Dolby Digital Plus,an Enhancement to the Dolby Digital Coding System”,AES会议论文6196,第117届AES会议,2004年10月28日。
杜比E编码的细节在下文中得到阐述:“Efficient Bit Allocation,Quantization,and Coding in an Audio Distribution System”,AES预印本5068,第107次AES会议,1999年8月;和“Professional Audio Coder Optimized for Use with Video”,AES预印本5033,第107次AES会议,1999年8月。
AC-3编码音频比特流的每帧包含针对数字音频的1536个样本的音频内容和元数据。对于48kHz的采样速率,这代表32毫秒的数字音频或者音频的31.25帧/秒的速率。
取决于帧分别包含1、2、3或6个音频数据块,E-AC-3编码音频比特流的每帧包含针对数字音频的256、512、768或1536个样本的音频内容和元数据。对于48kHz的采样速率,这分别代表5.333、10.667、16或32毫秒的数字音频或者音频的189.9、93.75、62.5或31.25帧/秒的速率。
如在图1中所示,每个AC-3帧被分成部分(片段),包括:同步信息(SI)部分,该部分包含(如图2中所示)同步字(SW)和两个纠错字中的第一个(CRC1);比特流信息(BSI)部分,该部分包含大部分元数据;6个音频块(AB0至AB5),其包含经数据压缩的音频内容(并且也可以包括元数据);浪费比特(W),其包含在压缩音频内容之后剩余的任何未使用的比特;辅助(AUX)信息部分,该部分可以包含更多元数据;以及两个纠错字中的第二个(CRC2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司,未经杜比实验室特许公司;杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480019912.1/2.html,转载请声明来源钻瓜专利网。