[发明专利]用于编码多对象音频信号的设备和方法有效
| 申请号: | 201210381376.2 | 申请日: | 2007-12-27 |
| 公开(公告)号: | CN102883257A | 公开(公告)日: | 2013-01-16 |
| 发明(设计)人: | 白承权;徐廷一;李泰辰;李用主;张大永;洪镇佑;金镇雄;姜京玉 | 申请(专利权)人: | 韩国电子通信研究院 |
| 主分类号: | H04S7/00 | 分类号: | H04S7/00 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张银英 |
| 地址: | 韩国*** | 国省代码: | 韩国;KR |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 编码 对象 音频 信号 设备 方法 | ||
本申请是申请日为2007年12月27日、申请号为200780051758.6、发明名称为“包括信息比特流转换的用于对具有各种声道的多对象音频信号进行编码和解码的设备和方法”的发明专利申请的分案申请。
技术领域
本发明涉及一种用于对具有各种声道的多对象音频信号进行编码和解码的设备和方法;且更具体地,涉及一种包括边信息(side information)比特流转换的用于对具有各种声道的多对象音频信号进行编码和解码的设备和方法,所述边信息比特流转换用于变换边信息比特流、并基于变换后的边信息比特流来恢复具有所期望的输出信号(即,各种声道)的多对象音频信号。
具有各种声道的多对象音频信号表示用于针对每个音频对象具有不同声道(例如,单声道、立体声和5.1声道)的多对象的音频信号。
这项工作受MIC/IITA的IT R&D规划[2005-S-403-02,“Development of Super-intelligent Multimedia Anytime-anywhere Realistic TV SmarTV Technology(超智能多媒体任何时间任何地点逼真TV智能TV技术的开发)”]支持。
背景技术
根据传统的音频编码/解码技术,用户应该被动地(inactively)聆听音频内容。这样,需要开发一种用于对在用于多个音频对象的多声道中的音频信号进行编码和解码的设备和方法,使得可以通过根据用户的需要而控制其每一个具有不同声道的音频对象并以各种方法而组合一个音频内容,来消费各种音频对象。
传统的空间音频编码(SAC)是一种用于将多声道音频信号代表、传送、和恢复为缩混后的单声道或立体声信号的技术,并且它可以以低比特率来传送高质量的多声道音频信号。
然而,由于传统的SAC能够对在仅用于一个音频对象的多声道中的信号进行编码和解码,所以它不能编码/解码多声道和多对象音频信号,例如,用于多声道(例如,单声道、立体声和5.1声道)中的各种对象的音频信号。
此外,传统的心理声学编码(BCC:Binaural Cue Coding)技术可以编码/解码用于多对象的音频信号。然而,由于音频对象的声道限于单声道,所以不能对具有包括单声道的各种声道的多对象音频信号进行编码/解码。
总之,由于传统的技术仅可以编码/解码具有单个声道的多对象音频信号、或者具有多声道的单对象音频信号,所以不能对具有各种声道的多对象音频信号进行编码/解码。因此,根据传统的音频编码/解码技术,用户应该被动地聆听音频内容。
相应地,需要开发一种用于对在用于每个多音频对象的各种声道中的音频信号进行编码和解码的设备和方法,以通过控制根据用户的需要而不同的多声道中的每个音频对象、并根据各种方法而组合一个音频内容来消费各种音频对象。
此外,需要一种用于将多对象音频比特流转换为传统的SAC比特流并且反之亦然的设备和方法,以提供在多对象音频编码器中创建的边信息比特流与传统的SAC编码器/解码器的边信息比特流之间的后向兼容性。
如上所述,作为用于通过单独控制具有不同声道的多个音频对象并根据各种方法而组合一个音频内容来对各种声道的多对象音频信号进行编码和解码的设备和方法,需要开发一种可执行比特流转换的多声道和多对象音频编码和解码设备及方法,以提供与传统SAC比特流的后向兼容性,并控制具有多声道的每个多音频对象,从而以多样的方法来组合一个音频对象。
发明内容
技术问题
本发明的实施例旨在提供一种用于对具有各种声道的多对象音频信号进行编码和解码、以提供与传统的空间音频编码(SAC)比特流的后向兼容性的设备和方法。
技术解决方案
根据本发明的一方面,提供了一种用于编码多对象音频信号的设备,包括:音频对象编码单元,用于基于空间线索(spatial cue)来编码输入到编码设备的音频对象信号,并创建用于编码后的音频对象信号的渲染信息,其中所述渲染信息包括用于音频对象信号的空间线索信息、音频对象信号的声道信息和音频对象信号的标识信息。
根据本发明的又一方面,提供了一种用于创建渲染信息来解码多对象音频信号的代码转换设备,包括:第一矩阵单元,用于基于已编码音频对象信号的对象控制信息和播放信息来创建渲染信息,该渲染信息包括用于已编码音频对象信号的功率增益信息和输出位置信息;和渲染单元,用于基于第一矩阵单元所创建的渲染信息和用于从编码设备输入的已编码音频对象信号的渲染信息,来创建用于要从解码设备输出的音频信号的空间线索信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩国电子通信研究院,未经韩国电子通信研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210381376.2/2.html,转载请声明来源钻瓜专利网。





