[发明专利]用于估计背景噪声的方法和背景噪声估计器在审
| 申请号: | 202110082903.9 | 申请日: | 2015-07-01 |
| 公开(公告)号: | CN112927724A | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 马丁·绍尔斯戴德 | 申请(专利权)人: | 瑞典爱立信有限公司 |
| 主分类号: | G10L25/78 | 分类号: | G10L25/78 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 林玉妹 |
| 地址: | 瑞典斯*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 估计 背景 噪声 方法 | ||
本发明涉及用于估计音频信号中的背景噪声的背景噪声估计器及其中的方法。所述方法包括基于以下各项获得与音频信号段(例如帧或帧的一部分)相关联的至少一个参数:第一线性预测增益,被计算为:针对所述音频信号段,来自0阶线性预测的残余信号与来自2阶线性预测的残余信号之间的商;以及,第二线性预测增益,被计算为:针对所述音频信号段,来自2阶线性预测的残余信号与来自16阶线性预测的残余信号之间的商。该方法还包括:至少基于所获得的至少一个参数,确定音频信号段是否包括停顿;以及,当所述音频信号段包括停顿时,基于所述音频信号段更新背景噪声估计。
本申请是申请日为2015年7月1日,申请号为201580040591.8,题为“用于估计背景噪声的方法和背景噪声估计器”的中国专利申请的分案申请。
技术领域
本发明的实施例涉及音频信号处理,并具体涉及背景噪声的估计,例如以支持声音活跃性判断。
背景技术
在利用不连续传输(DTX)的通信系统中,找到效率和不降低质量之间的平衡是重要的。在这种系统中,活跃性检测器用于指示要被主动编码的活跃信号(例如语音或音乐)以及具有背景信号的段,可由在接收机侧产生的舒适噪声来替换该具有背景信号的段。如果活跃性检测器在检测不活跃中过于有效,则它将在活跃信号中引入削波,然后当被削波的活跃段被舒适噪声替换时,该活跃信号被感知为主观质量劣化。同时,如果活跃性检测器不够有效并将背景噪声段分类为活跃的,且然后主动对背景噪声进行编码,而不是进入具有舒适噪声的DTX模式,则DTX的效率降低。在多数情况下,削波问题被视为更严重。
图1示出了广义声音活跃性检测器(SAD)或话音活跃性检测器(VAD)的概述框图,其将音频信号作为输入并产生活跃判断来作为输出。将输入信号划分为数据帧,即例如5-30ms(取决于实现)的音频信号段,并且针对每帧产生一个活跃性判断来作为输出。
由图1中示出的主检测器做出主判断“prim”。主判断基本上只是当前帧的特征与根据先前输入帧估计的背景特征的比较。当前帧的特征与背景特征之间大于阈值的差导致活跃主判断。延迟(hangover)加法块用于基于过去的主判断扩展主判断以形成最终判断:“标志”。使用延迟的原因主要是为了减小/去除在活跃突发的中间和后端削波的风险。如图所示,操作控制器可以根据输入信号的特性调整主检测器的阈值和延迟加法的长度。使用背景估计器块来估计输入信号中的背景噪声。在本文中,背景噪声还可以被称为“背景”或者“背景特征”。
可以根据两个基本不同的原理来进行背景特征的估计:通过使用如图1中的虚线所示的主判断(即利用判断或判断度量反馈),或者通过使用输入信号的一些其它特性(即不使用判断反馈)。还可以使用这两种策略的组合。
使用用于背景估计的判断反馈的编解码器的示例是AMR-NB(自适应多速率窄带),且不使用判断反馈的编解码器的示例是EVRC(增强可变速率CODEC)和G.718。
可以使用多种不同的信号特征或特性,但是在VAD中使用的一个公共特征是输入信号的频率特性。由于其低复杂度和在低SRN时的可靠操作,通常使用类型的频率特性是子带帧能量。因此假设输入信号被分割为不同频率子带,并针对每个子带估计背景电平。通过这种方式,背景噪声特征之一是具有针对每个子带的能量值的矢量,这些是在频域中表征输入信号中的背景噪声的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞典爱立信有限公司,未经瑞典爱立信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110082903.9/2.html,转载请声明来源钻瓜专利网。





