[发明专利]用于音频编解码器中的音频带宽检测和音频带宽切换的方法和设备在审
申请号: | 202180070612.6 | 申请日: | 2021-10-14 |
公开(公告)号: | CN116529814A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | V·埃克斯勒 | 申请(专利权)人: | 沃伊斯亚吉公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张姝贝 |
地址: | 加拿大*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 编解码器 中的 带宽 检测 切换 方法 设备 | ||
一种在声音编解码器的编码器部分中检测待编码的声音信号的音频带宽的方法和设备。该设备包括声音信号分析器和最终音频带宽决定模块,该最终音频带宽决定模块用于使用声音信号的分析的结果产生关于检测的音频带宽的最终决定。在编码器部分中,最终音频带宽决定模块位于声音信号分析器的上游。此外,一种方法和设备从声音信号的第一音频带宽切换到第二音频带宽。在编码器部分中,该设备包括:用于产生待编码的声音信号的关于检测的音频带宽的最终决定的最终音频带宽决定模块、响应于检测的音频带宽的最终决定而发生音频带宽切换的帧的计数值以及响应于帧的计数值的用于在对声音信号进行编码之前对其进行衰减的衰减器。
技术领域
本公开涉及声音编码,尤其但并非排他地涉及声音编解码器中的用于音频带宽检测的方法及设备以及用于音频带宽切换的方法及设备。
在本公开和所附权利要求书中:
-术语“声音”可以与语音、音频和任何其他声音相关;
-术语“立体声(stereo)”是“立体声(stereophonic)”的缩写;并且
-术语“单声道(mono)”是“单声道(monophonic)”的缩写。
背景技术
历史上,会话式电话是利用仅具有一个换能器以仅向用户耳朵中的一者输出声音的手持机来实现的。在最近十年中,用户已开始结合头戴式耳机使用其便携式手持机以经由其两个耳朵接收声音,主要用于收听音乐,但有时也收听语音。然而,当便携式手持机被用于发送和接收会话式语音时,内容仍为单声道的,但在头戴式耳机被使用时被呈现给用户的两只耳朵。
利用最新的3GPP(第三代合作伙伴计划)语音编码标准,即用于增强语音服务的编解码器(EVS),如其全部内容通过引用并入本文的参考文献[1]中所述,通过便携式手持机发送和接收的经编码的声音(例如语音和/或音频)的质量已得到显著改进。下一个自然步骤是发送立体声信息,使得接收器尽可能接近在通信链路的另一端处捕获的真实生活音频场景。
在音频编解码器中,通常使用立体声信息的传输。
对于会话式语音编解码器,单声道信号是常态。当传输立体声声音信号时,比特率通常需要加倍,因为立体声声音信号的左声道和右声道均使用单声道编解码器进行编码。为了降低比特率,已经开发并且使用了高效立体声编码技术。作为非限制性示例,在下面的段落中讨论了立体声编码技术的使用。
第一种立体声编码技术称为参数立体声。参数立体声使用公共单声道编解码器将左和右两个声道编码为单声道信号加上一定量的表示立体声图像的立体声边信息(对应于立体声参数)。两个输入的左声道和右声道被下混合成单声道信号,并且立体声参数然后通常在变换域中(例如在离散傅里叶变换(DFT)域中)计算,并且与所谓的双耳或声道间线索(“cue”)相关。双耳线索(参考文献[3],其全部内容通过引用并入本文)包括耳间电平差(ILD)、耳间时间差(ITD)和耳间相关性(IC)。根据信号特性、立体声场景配置等,一些或所有的双耳线索被编码并且传输到解码器。关于哪些双耳线索被编码并且传输的信息作为信令信息发送,其通常是立体声边信息的部分。特定的双耳线索也可以使用不同的编码技术进行量化,这会导致使用可变数量的比特。然后,除了量化的双耳线索之外,立体声边信息通常可以在中等和更高的比特率下包含由下混合产生的量化的残差信号。可以使用熵编码技术(例如算术编码器)对残差信号进行编码。通常,参数立体声编码在较低和中等比特率下最有效。具有在DFT域中计算的参数的参数立体声在本公开中将被称为DFT立体声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沃伊斯亚吉公司,未经沃伊斯亚吉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180070612.6/2.html,转载请声明来源钻瓜专利网。