[发明专利]一种基于多窗谱的语音减噪方法在审
申请号: | 201810996691.3 | 申请日: | 2018-08-29 |
公开(公告)号: | CN108877826A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 龙华;商林松;邵玉斌;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 多窗 减噪 方差 噪声 傅里叶反变换 音频信号处理 傅里叶变换 先验 纯净语音 平滑处理 噪声估计 小偏差 信噪比 减法 引入 | ||
本发明涉及一种基于多窗谱的语音减噪方法,属于音频信号处理技术领域。本发明通过使用多窗谱具有较小偏差和方差,从含噪语音的多窗谱来估计噪声,使得先验信噪比具有较小的方差,从而有利于噪声的消除,将其引入到谱减法中,使得噪声估计的偏差较小,并且在对语音进行傅里叶变换得到的幅度进行平滑处理,计算谱减后的幅值,最终进行傅里叶反变换得到减噪后的语音,减噪后的语音更接近纯净语音。
技术领域
本发明涉及一种基于多窗谱的语音减噪方法,属于音频信号处理技术领域。
背景技术
语音减噪属于语音增强技术,其本质就是语音降噪,换句话说,日常生活中,麦克风采集的语音通常是带有不同噪声的“污染”语音,语音增强的主要目的就是从这些被“污染”的带噪语音中恢复出我们想要的干净语音。
为了抑制语音中的噪声,学者们提出过一些语音增强方法。谱减法就是其中的一种,谱减法存在对噪声谱估计不准的缺点。
发明内容
本发明要解决的技术问题是:提供一种基于多窗谱的语音减噪方法,通过引入多窗谱对谱减法进行改进,同时对傅里叶变换后的幅值进行平滑处理,使得噪声大大降低,最终提取出的语音更接近纯净语音。
本发明采用的技术方案是:一种基于多窗谱的语音减噪方法,该方法包括以下步骤:
(1)语音采集:采集语音;
(2)语音信号的预处理:主要包括分帧、加窗处理;
(3)对预处理后的信号进行快速傅里叶变换(FFT),分别求其幅度谱|Xi(k)|和相位谱θi(k),在相邻帧之间做平滑处理,计算平均幅度谱
(4)将预处理后的信号进行多窗谱估计,得到多窗谱功率谱密度P(k,i);
(5)对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理,计算出平均功率谱密度Py(k,i);
(6)计算出噪声平均功率谱密度Pn(k);
(7)计算增益因子g(k,i);
(8)通过增益因子和平均幅度求得谱减后的幅度谱
(9)通过快速傅里叶反变换(IFFT)得到减噪后的语音信号
具体地,所述步骤(1)中的语音采集,在通过专业音频软件采集信号时,采样率fs≥2fh,fh为信号最高频率,设置声道数为单声道,采样频率为8000Hz,量化精度为16bit。
具体地,所述步骤(2)中预处理包括以下步骤:
(1)分帧:因为语音信号为短时平稳信号,所以需要进行分帧处理,以便把每一帧当成平稳信号处理。同时为了减少帧与帧之间的变化,相邻帧之间取重叠。一般帧长取25ms,帧移取帧长的一半。
(2)加窗:加窗之后是为了进行傅里叶展开,使全局更加连续,避免出现吉布斯效应,加窗之后,原本没有周期性的语音信号呈现出周期函数的部分特征。在语音信号分析中,常用的窗函数有矩形窗、海宁窗和汉明窗。
具体地,所述步骤(3)中,平均幅度谱的计算公式如下:
以i帧为中心前后各取M帧,共有2M+1帧进行平均。
具体地,所述步骤(4)中,多窗谱定义如下:
式中,L为数据窗个数;为k个数据窗的谱:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810996691.3/2.html,转载请声明来源钻瓜专利网。