[发明专利]一种语音降噪方法无效

申请号：	201010169091.3	申请日：	2010-05-11
公开（公告）号：	CN101866652A	公开（公告）日：	2010-10-20
发明（设计）人：	张涛;李海;张雯;赵亮;冯砚儒	申请（专利权）人：	天津大学
主分类号：	G10L21/02	分类号：	G10L21/02;G10L11/02
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	温国林
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音降噪领域，特别涉及一种应用于车内噪声谱缓慢变化环境下的语音降噪方法。

背景技术

随着科技的发展，现代化交通工具座舱中的噪声污染成为人们关注的话题。如何在这种相对封闭的环境中尽量降低由于发动机运转、气流与车身摩擦及空调风扇等所带来的噪声污染，从而得到令人满意的休息和语音交流的环境，成为国内外研究的热点。

针对这一需求，就要采用以提高车内语音信噪比(Signal to NoiseRatio，SNR)为目标的信噪分离技术。为此，现有技术中提出了基于小波的噪声检测技术、基于麦克风阵列的降噪方法以及基于噪声谱相减的信噪分离技术。通过上述方法和技术提高了车内语音信噪比，减少了噪声污染。

发明人在实现本发明的过程中，发现上述现有技术至少存在以下缺点和不足：

小波技术由于过于复杂，难以在当前数字信号处理器上实现；而麦克风阵列降噪受限于麦克风数量和阵列形状，不适合头戴式耳机的应用。由于车内噪声谱在一段时间内趋近于平稳，当前针对这一特点，采用噪声谱相减技术可以较容易的提高语音信号的信噪比，具体方法为在无语音通信阶段提前统计出稳态噪声的谱特性，在有语音段从语音和噪声的混合信号中减去噪声谱，从而得到纯净的语音信号。但是，车内噪声的稳态性并不是绝对的，在一段时间内会产生缓慢变化，并且在不同车速和路况条件下其谱分布也并不相同。因此若单纯采用此种方法在实际应用中会产生较大的误差，甚至进一步降低输入信号的信噪比。

发明内容

为了能更准确的获取到语音信号，提高输出信号的信噪比，本发明提供了一种语音降噪方法，所述方法包括以下步骤：

(1)将输入的信号按照分帧规则进行分帧；

(2)判断当前帧的开始是否为一段语音信号的起始点，如果是，执行步骤(3)；如果否，更新起始点之前的噪声平均功率谱，并准备处理下一帧，执行步骤(2)；

(3)获取当前帧混合信号的功率谱；

(4)根据步骤(2)中获取到的噪声平均功率谱和步骤(3)中获取到的混合信号的功率谱，获取纯净语音信号的功率谱，获取并输出时域波形，并准备处理下一帧；

(5)判断当前帧的开始是否为语音信号的终止点，如果是，执行步骤(6)；如果否，执行步骤(3)；

(6)清空上次计算噪声平均功率谱过程中得到的N×Frame_Length长度缓冲区中的数据，执行步骤(9)，其中，N为帧的数量，Frame_Length为一帧采样点数；

(7)判断当前帧开始是否为语音信号的起始点，如果是，执行步骤(8)；如果否，执行步骤(9)；

(8)判断无语音段是否达到固定长度N×Frame_Length，如果是，使用当前更新得到的噪声平均功率谱，执行步骤(3)；如果否，将上一无语音段中获取到的噪声平均功率谱作为当前的噪声平均功率谱，执行步骤(3)；

(9)将所有的N帧数据左移一帧，将当前帧作为第N帧数据，更新噪声平均功率谱，并准备处理下一帧，执行步骤(7)。

步骤(8)中的所述如果否，将上一无语音段中获取到的噪声平均功率谱作为当前的噪声平均功率谱，具体为：

无语音段小于固定长度，为一段连续语音的短暂停顿或是由于语音动态检测误将语音段误判为噪声段，造成对噪声平均功率谱统计错误，不进行噪声平均功率谱更新，将上一无语音段中获取到的噪声平均功率谱作为当前的噪声平均功率谱。

步骤(9)中的所述将所有的N帧数据左移一帧，将当前帧作为第N帧数据，具体为：

将所有的N帧数据左移1帧，舍弃原有的第1帧数据，原有的第2帧数据作为当前的第1帧数据，以此类推，最后将当前帧作为第N帧数据。

步骤(2)、(5)、(7)和(8)中所述的判断方法，具体为：语音动态检测。

步骤(2)、(8)和(9)中所述的更新噪声平均功率谱，具体为：

获取每一帧的功率谱，再对所有帧的功率谱取平均，将平均后的功率谱作为更新后的噪声平均功率谱。

本发明实施例提供的技术方案的有益效果是：

通过采用语音端点检测，获取到语音段的起始和终止位置，并通过在无语音段时实时更新噪声谱的方式跟踪噪声的变化，由于在语音段总是采用之前最新更新的噪声谱进行功率谱相减，因此能够最大限度减小噪声不断缓慢变化所带来的误差；同时在语音动态检测后设置了噪声最短长度限制，最大程度的避免了在连续语音段中将语音误检为噪声，造成对噪声平均功率谱统计错误的情况，从而进一步地获取到更准确的语音信号，提高输出信号的信噪比，满足了实际应用中的需要。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010169091.3/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音降噪方法无效

专利文献下载