[发明专利]根据下混的音频场景的重构有效
申请号: | 201480029538.3 | 申请日: | 2014-05-23 |
公开(公告)号: | CN105229731B | 公开(公告)日: | 2017-03-15 |
发明(设计)人: | T·赫冯恩;H·普恩哈根;L·J·萨米尔森;L·维尔莫斯 | 申请(专利权)人: | 杜比国际公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;H04S7/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 宋岩 |
地址: | 荷兰阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 音频对象与位置元数据相关联。接收到的下混信号包括作为一个或更多个音频对象的线性组合并且与相应位置定位符相关联的下混通道。在第一方面,下混信号、位置元数据和依频率而定的对象增益被接收。通过根据基于位置元数据和位置定位符的系数向下混信号的上混应用对象增益来重构音频对象。在第二方面,音频对象已被与位于对应下混通道的位置定位符处的至少一个声床通道编码在一起。解码系统接收下混信号和音频对象的位置元数据。通过基于对应下混通道的位置定位符从对应下混通道中抑制表示音频对象的内容来重构声床通道。 | ||
搜索关键词: | 根据 音频 场景 | ||
【主权项】:
一种用于对具有至少多个音频对象的音频场景的时间帧进行编码的方法,该音频场景被分段到频带中,该方法包括:接收N个音频对象和关联的位置元数据,其中N>1;生成包括M个下混通道的下混信号,每个下混通道是N个音频对象中的一个或更多个音频对象的线性组合并且与位置定位符相关联,其中M>1;针对每个音频对象:基于与该音频对象相关联的位置元数据和下混通道的位置定位符来计算指示出该音频对象和每个下混通道的空间相关度的相关系数;并且针对每个频带:以使通过对象增益重新调节的相关系数和下混信号的内积近似于时间帧中的音频对象的方式来确定该对象增益;以及生成包括下混信号、位置元数据和对象增益的比特流。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480029538.3/,转载请声明来源钻瓜专利网。
- 上一篇:具有动态可变的线圈形状的感应线圈
- 下一篇:多识别器语音识别