[发明专利]用于基于对象的音频的交互式渲染的方法和系统有效
| 申请号: | 201480019107.9 | 申请日: | 2014-03-19 |
| 公开(公告)号: | CN105103570B | 公开(公告)日: | 2018-02-13 |
| 发明(设计)人: | R·A·弗朗斯;T·齐埃格勒;S·S·梅塔;A·J·道尔;P·桑索姆布恩;M·D·德怀尔;F·法拉哈尼;N·R·茨恩高斯;F·桑切斯 | 申请(专利权)人: | 杜比实验室特许公司;杜比国际公司 |
| 主分类号: | H04S7/00 | 分类号: | H04S7/00;G10L19/008 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 欧阳帆 |
| 地址: | 美国加*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 基于 对象 音频 交互式 渲染 方法 系统 | ||
1.一种用于生成基于对象的音频节目的方法,所述方法包括以下步骤:
确定指示一组音频信号的第一子集的音频内容的至少一床扬声器声道,其中所述一组音频信号指示所捕捉的音频内容;
确定指示所述一组音频信号的第二子集的音频内容的一组对象声道;
生成指示对象声道的对象相关元数据;及
生成基于对象的音频节目,使得所述基于对象的音频节目指示每床扬声器声道、对象声道以及对象相关元数据,并且所述基于对象的音频节目能够渲染为提供被感知为由所述至少一床扬声器声道指示的第一音频内容与由对象声道的子集指示的第二音频内容的混合的声音,
其中对象相关元数据的至少一部分指示能由终端用户选择的所述一组对象声道的子集以及要在不存在终端用户选择时渲染的所述一组对象声道的默认子集。
2.如权利要求1所述的方法,其中所述基于对象的音频节目是包括帧的编码比特流,所述编码比特流是AC-3比特流或E-AC-3比特流,所述编码比特流的每一帧指示至少一个数据结构,该数据结构是包括对象声道的一些内容和对象相关元数据中的一些对象相关元数据的容器,并且至少一个所述容器被包括在每个所述帧的auxdata字段中。
3.如权利要求1所述的方法,其中所述基于对象的音频节目是包括帧的编码比特流,所述编码比特流是AC-3比特流或E-AC-3比特流,所述编码比特流的每一帧指示至少一个数据结构,该数据结构是包括对象声道的一些内容和对象相关元数据中的一些对象相关元数据的容器,并且至少一个所述容器被包括在每个所述帧的addbsi字段中。
4.如权利要求1所述的方法,其中所述基于对象的音频节目是包括一系列突发以及突发对之间的保护带的杜比E比特流,每个所述保护带包含一系列片段,并且至少一些所述保护带中的每一个的前X个片段中的每一个片段包括对象声道的一些内容和所述对象相关元数据中的一些对象相关元数据,其中X是数字。
5.如权利要求1所述的方法,其中所述对象相关元数据中的至少一些对象相关元数据指示分层的混合图,该分层的混合图指示扬声器声道与对象声道的可选混合,并且该分层的混合图包括元数据的基本层和元数据的至少一个扩展层。
6.如权利要求1所述的方法,其中所述对象相关元数据中的至少一些对象相关元数据指示混合图,该混合图指示扬声器声道与对象声道的可选混合,所述基于对象的音频节目是包括帧的编码比特流,并且所述编码比特流的每一帧包括指示所述混合图的对象相关元数据。
7.一种用于生成基于对象的音频节目的系统,包括:
第一子系统,被配置为:确定指示一组音频信号的第一子集的音频内容的至少一床扬声器声道,其中所述一组音频信号指示所捕捉的音频内容;确定指示所述一组音频信号的第二子集的音频内容的一组对象声道;并且生成指示对象声道的对象相关元数据;及
编码子系统,被耦接到第一子系统并且被配置为生成基于对象的音频节目,使得所述基于对象的音频节目指示每床扬声器声道、对象声道以及对象相关元数据,并且所述基于对象的音频节目能够渲染为提供这样的声音:该声音被感知为由所述至少一床扬声器声道指示的第一音频内容与由对象声道的子集指示的第二音频内容的混合,
其中对象相关元数据的至少一部分指示能由终端用户选择的所述一组对象声道的子集以及要在不存在终端用户选择时渲染的所述一组对象声道的默认子集。
8.如权利要求7所述的系统,其中基于对象的音频节目是包括帧的编码比特流,该编码比特流是AC-3比特流或E-AC-3比特流,该编码比特流的每一帧指示至少一个数据结构,该数据结构是包括对象声道的一些内容和所述对象相关元数据中的一些对象相关元数据的容器,并且至少一个所述容器被包括在每一帧的auxdata字段或addbsi字段中。
9.如权利要求7所述的系统,其中所述基于对象的音频节目是包括一系列突发以及突发对之间的保护带的杜比E比特流,每个所述保护带由一系列片段组成,并且至少一些所述保护带中的每一个保护带的前X个片段中的每一个片段包括对象声道的一些内容和所述对象相关元数据中的一些对象相关元数据,其中X是数字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司,未经杜比实验室特许公司;杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480019107.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图案标记
- 下一篇:服务器设备、客户端设备、内容分发方法以及计算机程序





