[发明专利]利用对象特定时间/频率分辨率从混合信号分离音频对象在审
| 申请号: | 201480027540.7 | 申请日: | 2014-05-09 |
| 公开(公告)号: | CN105378832A | 公开(公告)日: | 2016-03-02 |
| 发明(设计)人: | 萨沙·迪施;约尼·保卢斯;托尔斯滕·卡斯特纳 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
| 主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/20;G10L25/18 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;陈炜 |
| 地址: | 德国*** | 国省代码: | 德国;DE |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 利用 对象 特定 时间 频率 分辨率 混合 信号 分离 音频 | ||
提出了一种用于解码包括降混信号X和侧信息PSI的多对象音频信号的音频解码器。该侧信息包括针对时间/频率区R(tR,fR)中的音频对象Si的对象特定的侧信息PSIi,和指示针对时间/频率区R(tR,fR)中的音频对象si的对象特定的侧信息的对象特定的时间/频率分辨率TFRh的对象特定的时间/频率分辨率信息TFRIi。音频解码器包括对象特定的时间/频率分辨率确定器110,其被配置成根据针对音频对象si的侧信息PSI而确定对象特定的时间/频率分辨率信息TFRIi。音频解码器还包括对象分离器120,其被配置成根据对象特定的时间/频率分辨率TFRIi,利用对象特定的侧信息而从降混信号X中分离音频对象si。也描述了用于解码或编码的相应的编码器和相应的方法。
技术领域
本发明涉及音频信号处理,且具体而言涉及用于采用音频对象自适应单独时间-频率分辨率进行音频对象编码的解码器、编码器、系统、方法及计算机程序。
根据本发明的实施例涉及用于解码由降混信号及对象相关的参数侧信息(PSI)组成的多对象音频信号的音频解码器。根据本发明的其他实施例涉及用于根据降混信号表示及对象相关的PSI来提供升混信号表示的音频解码器。本发明的其他实施例涉及用于解码由降混信号及相关的PSI组成的多对象音频信号的方法。根据本发明的其他实施例涉及用于根据降混信号表示和对象相关的PSI来提供升混信号表示的方法。
本发明的其他实施例涉及用于将多个音频对象信号编码成降混信号及PSI的音频编码器。本发明的其他实施例涉及用于将多个音频对象信号编码成降混信号及PSI的方法。
根据本发明的其他实施例涉及对应于用于解码、编码和/或提供升混信号的方法的计算机程序。
本发明的其他实施例涉及用于信号混合操纵的音频对象自适应单独时间-频率分辨率切换。
背景技术
在现代数字音频系统中,在接收机侧上允许所传输内容的音频对象相关的修改为主要趋势。这些修改包括音频信号的选定部分的增益修改和/或在经由空间分布式扬声器进行的多信道回放的情况下的专用音频对象的空间重新定位。这可藉由将音频内容的不同部分单独传递至不同扬声器来达成。
换言之,在音频处理、音频传输及音频储存的技术中,越来越希望允许对象导向的音频内容回放上的用户交互,并且也需要利用多信道回放的延伸可能性来单独渲染音频内容或部分音频内容,以便改进听觉印象。由此,多信道音频内容的使用为用户带来显著的改进。例如,可获得三维听觉印象,该三维听觉印象带来改进的用户对娱乐应用的满意度。然而,多信道音频内容在专业环境中也是有用的,例如在电话会议应用中,这是因为通话器可懂度可通过使用多信道音频回放来改进。另一可能的应用是为收听器提供音乐片段以单独调整不同部分(也称为“音频对象”)或诸如人声零件或不同乐器这样的轨道的回放水平和/或空间位置。用户可出于个人品味的原因、为了更容易转录来自音乐片段、教育目的、伴唱机、排演等的一或更多个部分而执行这样的调整。
例如以脉冲代码调制(PCM)数据或甚至压缩音频格式的形式的所有数字多信道或多对象音频内容的直接离散传输需要极高的比特率。然而,也希望以比特率有效的方式传输且储存音频数据。因此,愿意接受音频质量与比特率要求之间的合理折衷,以便避免由多信道/多对象应用导致的过度资源负载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480027540.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:远程监视监控监测供水设备装置
- 下一篇:带语音识别的智能场景控制器





