[发明专利]一种结合MMSE和谱减法的语音增强方法有效
申请号: | 201710978076.5 | 申请日: | 2017-10-18 |
公开(公告)号: | CN107610712B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 颜钱明;虞安波 | 申请(专利权)人: | 会听声学科技(北京)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216;G10L21/0208;G10L25/18 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 郭新娟 |
地址: | 100000 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 mmse 减法 语音 增强 方法 | ||
1.一种结合MMSE和谱减法的语音增强方法,其特征在于:
获取输入语音,对输入语音做预加重及短时傅立叶变换处理得到语音谱,从中估计初始噪声谱,采用MMSE算法预处理;
预处理后的语音用改进的谱减法进一步处理,并引入孤立因子抑制音乐噪声的产生;然后将处理后的频谱反傅立叶变换以及去加重得到最终音频;
所述改进的谱减法包括:对于上面得到的处理信号,采用改进的谱减法,得到增益矩阵G,具体公式如下:其中α是根据当前帧信噪比γ定的参数,确定谱减的程度,β是一个接近0的参数;第k帧第i个点的信噪比参数其中截距minα,maxα,minγ,maxγ是手动设置的上下限,Y,N表示短时傅立叶变换中变换到频域后的带噪语音和加性噪声;
所述孤立因子包括:上面得到的增益矩阵G以及初步纯净语音估计值,所述初步纯净语音估计值通过所述短时傅立叶变换中的纯净部分求得,根据相邻位置上数值的相关性判断音乐噪声的位置,所述孤立因子其中ιu,ιd分别是根据当前点后2~5个点和当前点之前2~5个点计算得出的参数,用以反映语音相邻元素之间的相关性;对音乐噪声作自适应的判别后,将其与所述增益矩阵G点乘,得到修饰过后的增益矩阵。
2.根据权利要求1所述的一种结合MMSE和谱减法的语音增强方法,其特征在于,所述预加重包括:采用滤波器H(z)=1-μz-1对原始语音滤波,提升高频质量,其中z表示作z变换,μ是预加重系数。
3.根据权利要求1所述的一种结合MMSE和谱减法的语音增强方法,其特征在于,所述短时傅立叶变换包括:带噪语音、纯净部分、加性噪声分别用y(t),s(t),n(t)表示,有y(t)=s(t)+n(t),假设语音与噪声不相关,对语音分帧加汉明窗,变换到频域后对第k帧第i个点有Y2(k,i)=S2(k,i)+N2(k,i),其中Y,S,N表示变换到频域后的带噪语音、纯净部分和加性噪声。
4.根据权利要求1所述的一种结合MMSE和谱减法的语音增强方法,其特征在于,所述估计初始噪声谱包括:利用语音间隙估计噪声功率谱N2(k,i);静寂帧的起始段采用VAD语音活动检测,将最长的一段判别为噪声的起点作为估计噪声的起点,并返回那段噪声的长度;设静寂段帧数为NIS,则估计噪声谱并且每一次迭代过程中,利用VAD语音活动检测更新此估计值。
5.根据权利要求1所述的一种结合MMSE和谱减法的语音增强方法,其特征在于,所述MMSE预处理包括:估计后验信噪比采用直接判决法估计出先验信噪比ξk,可求得MMSE的增益矩阵,得到处理信号。
6.根据权利要求1所述的一种结合MMSE和谱减法的语音增强方法,其特征在于,所述反傅立叶变换以及去加重处理包括:根据增强后的频域结果,配合原始语音信号的相位谱,对其进行傅立叶反变换和去加重处理得到最终增强的语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于会听声学科技(北京)有限公司,未经会听声学科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710978076.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种声纹识别方法及装置
- 下一篇:基于时延估计的回声消除方法及装置