[发明专利]用于语音增强系统的背景噪声估计方法有效
申请号: | 201310538432.3 | 申请日: | 2013-11-04 |
公开(公告)号: | CN103559887A | 公开(公告)日: | 2014-02-05 |
发明(设计)人: | 张勇;刘轶 | 申请(专利权)人: | 深港产学研基地 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平 |
地址: | 518057 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 增强 系统 背景 噪声 估计 方法 | ||
技术领域
本发明涉及语音增强处理技术领域,特别是涉及一种用于语音增强系统的背景噪声估计方法。
背景技术
在语音增强处理的过程中,比较关键的一步就是对背景噪声的估计。噪声估计过高,在滤除噪声时微弱语音将被去掉,使得经过增强处理的语音产生大的失真;而噪声估计过低,在滤除噪声后会残留过多的背景噪声。当背景噪声为平稳噪声时,通过对静音段的噪声功率谱取均值可得噪声的估计值。当背景噪声为非平稳噪声时,由于噪声随时间快速变化,噪声的估计就比较困难,要克服这个问题,需要对噪声进行连续跟踪与修正。
传统的噪声估计法是基于语音活动检测(Voice Activity Detector,VAD)的噪声估计方法。该方法在信噪比较高的情况下可以得到较好的噪声估计,但是在低信噪比的情况下,对语音信号的检测变得比较难,VAD的误检率很高,噪声估计不准确。
实际噪声通常是非平稳的,在语音存在期间噪声也可能发生变化,要想取得好的语音增强效果,就必须随时跟踪噪声的变化,及时更新噪声估计。Doblinger通过比较前帧带噪语音子带平滑功率谱最小值和后帧带噪语音子带平滑功率谱之间大小,对带噪语音子带平滑功率谱最小值每帧进行追踪和更新,并将其作为估计的噪声谱,该噪声谱估计方法计算效率高,能快速适应背景噪声的变化,但它直接把带噪语音子带平滑功率谱最小值作为估计的噪声谱,使得估计的噪声谱准确度不高,同时它会将带噪语音中语音电平的突然上升当作噪声电平突变的情况来处理,造成噪声的过估计。
Martin提出了基于最优平滑和最小统计的噪声估计算法,它依据带噪语音能量可以衰减到噪声能量级的思想,通过对平滑后的带噪语音的短时功率谱取最小值来获得噪声功率估计。然而,该方法在估计噪声时,当搜索窗较小时会削弱语音能量,当搜索窗太大时,其噪声估计更新较慢难以实时估计噪声。
Israel Cohen提出了改进的最小受控递归平均(Improved Minima Controlled Recursive Average,IMCRA)噪声估计法,其可以进行连续的噪声估计。算法使用一个时变频率依赖的平滑因子对过去信号帧的功率谱进行平均后估计噪声,该平滑因子依据语音信号存在概率调整。语音出现概率的估计基于高斯统计模型,但受平滑周期图的最小值控制控制。该算法包括两次平滑和最小值跟踪过程。第一次平滑过程对每个频带语音出现情况做粗略的估计,然后在第二次平滑过程中通过最小值跟踪剔除强语音分量,对噪声谱进行平滑。但是,现有的IMCRA噪声估计方法是在语音缺失段对噪声进行递归平滑而在语音段则对噪声的估计保持不变。然而,在实际情况中,噪声通常是非平稳的,即使在语音信号存在期间,噪声也可能会发生变化。
发明内容
基于此,有必要提供一种能够实时跟踪带噪语音中的噪声变化的背景噪声估计方法。
一种语音噪声估计方法,包括如下步骤:
对目标信号利用窗函数分成相互叠加的帧并对每帧进行短时傅立叶变换,得到目标信号的频域表示:Y(k,l)=X(k,l)+D(k,l);其中Y(k,l)是带噪语音信号进行快速傅立叶变换变换后的频谱,X(k,l)是纯语音信号进行快速傅立叶变换变换后的频谱,D(k,l)是与语音信号无关的加性噪声进行快速傅立叶变换变换后的频谱;k表示频谱序号,l表示帧序号;
将所述目标信号根据语音出现与否划分为语音出现状态H1(k,l)和语音缺失状态H0(k,l),并按照如下公式估计噪声:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深港产学研基地,未经深港产学研基地许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310538432.3/2.html,转载请声明来源钻瓜专利网。