[发明专利]一种环境自适应的语音混响消除方法和系统有效
申请号: | 201510761023.9 | 申请日: | 2015-11-10 |
公开(公告)号: | CN105448302B | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 卓鹏鹏;李稀敏;肖龙源 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L15/02;G10L15/06;G10L15/20 |
代理公司: | 厦门市新华专利商标代理有限公司 35203 | 代理人: | 朱凌 |
地址: | 361000 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环境 自适应 语音 混响 消除 方法 系统 | ||
本发明公开一种环境自适应的语音混响消除方法和系统,该系统包括有混响模型训练装置、RT60获取装置以及音频处理装置;首先,考虑到RT60值的大小可以近似表征房间的混响量的大小及特殊的室内应用环境(RT60的值会在一个较小的范围内),本发明中将RT60值按大小分成多个区间,使用区间内的语音特征来训练混响模型,使得数据训练的更加充分,混响模型更有针对性;其次,通过结合当前环境的RT60值所在区间和使用对应区间的混响模型进行解码的方法实现了对不同房间环境的自适应;再者,由于采用深度网络训练模型,在实际应用时就不需要估计混响分量,直接根据模型参数进行解码即可得到混响消除后的语音特征,减少了计算量。
技术领域
本发明涉及语音混响消除领域技术,尤其是指一种环境自适应的语音混响消除方法和系统。
背景技术
在室内采集语音信号时,若声源与采集的麦克风距离较远,就会有混响。过大的混响会严重影响语音的清晰度和可懂度。在语音识别和说话人识别系统中,混响的出现将会使训练数据与测试数据不匹配影响系统的性能,严重时还可能导致系统无法正常工作。此时,一种有效的混响的消除方法就变得极其重要了。常用的混响消除算法大多是从语音中估计出混响分量,然后进行混响消除,然而这在实际中是很困难的。
文献[K.Lebart,2001]使用Polack混响统计模型的单麦克风混响消除系统。该混响消除系统根据混响时间来构造Polack混响统计模型,利用Polack混响统计模型估计出后期混响功率谱,最后采用谱减法去除后期混响,达到语音增强的效果。由于该技术要求已知混响时间先估计出后期混响后采用谱减法求解出没受污染部分的分量,实现混响消除。然而实际应用中很难直接得到准确的混响时间,这导致采用谱减法去除后期混响时常会引入一些人工噪声。在过估计时,会产生音乐噪声;欠估计时会有噪声残留。
文献[Marc Delcroix,2014]提供了WPE(Weighted Prediction Error)算法的混响消除方法。该方法采用线性滤波的方法进行混响消除。首先对语音进行短时傅里叶变换(Short-time Fourier Transform,STFT);然后在频域通过迭代估计出一组最优的线性滤波器的参数;最后采用线性滤波器对STFT系数进行滤波,得到语音中消除混响后的STFT系数估计,实现对混响的消除。该算法在进行迭代估计时需要进行较多的运算,并且滤波器的长度需要人为设定。实际应用环境中,混响的影响并不是固定的,采用固定的滤波器长度将很难实现在不同环境下的稳定工作。
发明内容
有鉴于此,本发明针对现有技术存在之缺失,其主要目的是提供一种环境自适应的语音混响消除方法和系统,其能够对大多数的室内环境下的语音混响进行消除,并且能够迅速的适应室内环境的变化,实现对室内混响环境的自适应。
为实现上述目的,本发明采用如下之技术方案:
一种环境自适应的语音混响消除方法,包括有以下步骤:
步骤100:使用混响模型训练装置训练混响模型,并且将训练得到的混响模型存储于音频处理装置的第二存储器中;
步骤200:采用RT60获取装置获取当前环境下的RT60值,并且发送给音频处理装置;
步骤300:输入获取到的数字语音信号;
步骤400:使用音频处理装置中的第二特征提取模块提取输入语音的MFCC,具体步骤与混响模型训练装置中的特征提取一致;
步骤500:将原始的特征经过前5帧后4帧的扩展,形成320维数据,再将320维数据的每一维进行均值方差归一化处理;
步骤600:根据获取到的RT60值,读取第一存储器里对应的混响模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510761023.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音信号的处理方法和装置
- 下一篇:一种基于声纹识别的音频处理方法及系统