[发明专利]基于二次谱减法的复杂噪声背景下的语音识别方法和系统在审
申请号: | 202210711617.9 | 申请日: | 2022-06-22 |
公开(公告)号: | CN115132219A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 邵鹏志;谢志豪;王乃正;孟英谦;彭龙;李胜昌;宋彪;邬书豪;李泽宇;张世超;魏中锐;任智颖;葛祥雨;胡明哲;霸建民;高圣楠;张敏 | 申请(专利权)人: | 中国兵器工业计算机应用技术研究所 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L15/04 |
代理公司: | 北京天达知识产权代理事务所(普通合伙) 11386 | 代理人: | 庞许倩 |
地址: | 100089*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 二次 减法 复杂 噪声 背景 语音 识别 方法 系统 | ||
本发明涉及一种基于二次谱减法的复杂噪声背景下的语音识别方法和系统,属于语音增强技术领域。该方法包括:选取复杂噪声背景下的含噪历史音频和纯净噪声音频,经过计算处理得到历史噪声估计;对复杂噪声背景下的待识别音频进行分帧处理,得到多帧音频;依次对每帧音频进行处理:基于历史噪声估计和当前帧音频的噪声估计,确定历史噪声移除因子和当前帧音频噪声移除因子,对当前帧音频进行二次谱减,得到当前帧音频降噪后的语音频谱。该方法解决了对于现实世界中的背景噪声复杂采用现有技术无法将残余噪声控制到较低水平的问题。
技术领域
本发明属于语音增强技术领域,尤其涉及一种基于二次谱减法的复杂噪声背景下的语音识别方法和系统。
背景技术
谱减法是语音增强算法之一。语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从具有噪声的语音信号中提取有用的语音信号,抑制、降低噪声干扰的技术。然而噪声干扰通常都是随机的,从带噪声语音中提取完全纯净的语音信号几乎不可能。在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪声,这是一种主观度量;二是提升语音识别,说话人识别等语音任务效果,这是一种客观度量。但是这两种目的往往不能兼得,比如一些语音增强的算法可以显著地降低背景噪声,改进语音质量,但是并不能提高语音识别的效果,甚至是略有下降。
谱减法是处理带宽噪声较为传统和有效的语音增强算法,其基本思想是在假定加性噪声与短时平稳的语音信号相互独立的条件下,从带噪语音信号中减去噪声功率谱,从而得到较为纯净的语音频谱。谱减法突出的优点是算法计算量比较小,运算量比较低,计算复杂度很低,并且适用于实时处理的场景。缺点是处理后的信号会残留比较多的噪声,被称为音乐噪声。
为了减弱谱减法所带来的音乐噪声,Berouti提出频谱过减算法,通过使用噪声移除因子来减小频谱相减残留的宽带谱峰的幅度,使用最低音频能量来填充谱谷(频谱相减的负值)从而控制残留噪声的多少以及音乐噪声的大小。过减谱减法表达式如下:
其中,Py(ω)、Ps(ω)、Pn(ω),分别表示含噪信号、纯净语音信号和噪音信号的功率谱;α是噪声移除因子,是音频频谱减去噪声频谱的系数;b表示音频中保留的最低音频能量;
谱减法以及过减谱减法都是在稳态的背景噪声环境下成立的,即噪声对语音的所有频谱分量具有同等程度的影响。但是现实世界中的背景噪声是随时变化的,不同的干扰噪声对语音各个频段的影响不尽相同,过减谱减法仍然不能将残余噪声控制到较低的水平。
发明内容
鉴于上述的分析,本发明旨在提供一种基于二次谱减法的复杂噪声背景下的语音识别方法,对于含噪历史音频进行噪声估计,对于当前音频噪声估计,经计算确定历史噪声移除因子和当前帧音频噪声移除因子,对待识别含噪音频进行二次谱减,以解决现实世界中的背景噪声复杂,采用现有技术无法将残余噪声控制到较低水平的问题。
一方面,本发明提供了一种基于二次谱减法的复杂噪声背景下的语音识别方法,具体包括如下步骤:
基于复杂噪声背景下的含噪历史音频和纯净噪声音频,得到所述复杂噪声背景的历史噪声估计;
对复杂噪声背景下的待识别音频进行分帧处理,得到多帧音频;
依次对每帧音频进行处理,得到降噪后的语音;其中,对当前帧音频处理,包括:基于所述历史噪声估计和当前帧音频的噪声估计,对所述当前帧音频进行二次谱减,得到所述当前帧音频降噪后的语音频谱。
进一步的,所述基于复杂噪声背景下的含噪历史音频和纯净噪声音频,得到所述复杂噪声背景的历史噪声估计,包括:
分别对每条所述含噪历史音频分帧,处理后得到含噪历史音频每帧信号的功率谱;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国兵器工业计算机应用技术研究所,未经中国兵器工业计算机应用技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210711617.9/2.html,转载请声明来源钻瓜专利网。