[发明专利]一种基于LSTM的后期混响抑制方法及系统在审
| 申请号: | 202010023100.1 | 申请日: | 2020-01-09 |
| 公开(公告)号: | CN111462770A | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 计健雄;郭鹏 | 申请(专利权)人: | 华中科技大学 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0224;G10L25/12;G10L25/18;G10L25/30;G10L25/45 |
| 代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
| 地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 lstm 后期 混响 抑制 方法 系统 | ||
本发明公开了一种基于LSTM的后期混响抑制方法及系统,包括以下步骤:S1、对待处理的混响语音信号进行分帧,并提取各帧的频谱特征序列;S2、将所得各帧的频谱特征序列依次输入到预训练好的后期混响抑制网络中,对所述频谱特征序列中的后期混响特征进行抑制,得到各帧的增强信号特征序列;S3、对所得各帧的增强信号特征序列进行恢复,得到后期混响抑制后的语音信号;其中,增强信号特征包括干语音和前期反射信号特征;通过基于LSTM的后期混响抑制网络,在时间序列上对语音信号进行建模,对频谱特征序列中的后期混响特征进行实时过滤,且仅对后期这种强烈的混响进行了抑制,并不抑制前期反射,能够做到适量的混响抑制,混响抑制后的声音听觉效果较好。
技术领域
本发明属于语音信号处理领域,更具体地,涉及一种基于LSTM的后期混响抑制方法及系统。
背景技术
声波在室内传播时,要被墙壁、天花板、地板等障碍物反射,每反射一次都要被障碍物吸收一些。当声源停止发声后,声波在室内要经过多次反射和吸收,最后才消失,我们就感觉到声源停止发声后声音还会继续一段时间,这种现象叫做混响。适量的混响能使声音圆润动听,听起来有空间感,但是强烈的后期混响会严重降低语音清晰度和声音质量,在语音信号处理领域,影响语音识别系统的语音识别性能和声音质量。故研究一种后期混响抑制方法及系统具有重要的意义。
在传统的去混响算法中,大多采用单通道去混响算法,例如采用频谱减法算法,通过假设混响的指数衰减模型来抑制后期混响,当室内物品较多,室内环境比较复杂时,这种混响的衰减模型并不能很好的估计混响的真实模型,去混响的效果不佳,适用范围有限;另外,该方法还需要已知混响时间这一参数,易导致谱失真。为了解决以上问题,现有的语音混响抑制方法基于监督语音增强算法,如采用深度神经网络(Deep Neural Networks,DNN)从混响语音的对数谱到无声语音的对数信息幅度谱中学习映射函数,进行混响抑制,该方法需要预先收集大量的数据进行训练,且是一种非因果方法,无法对时间序列上的变化进行建模,同时无法利用上下文时间信息对混响进行估计,无法适用于实时的语音识别系统;另外,该方法在抑制过程中未考虑语音信号时域上的关联信息,并且没有区分后期混响和前期反射,除了对后期这种强烈的混响进行了抑制,同时也抑制了前期反射,直接导出干语音,无法做到适量的混响抑制,混响抑制后的声音听觉效果不佳。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于长短期记忆循环神经网络(Long Short Term Memory,LSTM)的后期混响抑制方法及系统,其目的在于解决现有技术由于同时抑制了后期混响和前期反射,且在抑制过程中并未考虑语音信号时域上的关联信息而导致的混响抑制后声音的听觉效果不佳的技术问题。
为实现上述目的,第一方面,本发明提供了一种基于LSTM的后期混响抑制方法,包括以下步骤:
S1、对待处理的混响语音信号进行分帧,并提取各帧的频谱特征序列;
S2、将所得各帧的频谱特征序列依次输入到预训练好的后期混响抑制网络中,对所述频谱特征序列中的后期混响特征进行抑制,得到各帧的增强信号特征序列;
S3、对所得各帧的增强信号特征序列进行恢复,得到后期混响抑制后的语音信号;
其中,增强信号特征包括干语音和前期反射信号特征;后期混响抑制网络为基于LSTM的网络,用于根据语音信号在时域上的关联信息,对频谱特征序列中的后期混响特征进行实时过滤。
本发明的有益效果是:通过基于LSTM的后期混响抑制网络,在时间序列上对语音信号进行建模,通过考虑语音信号在时域上的关联信息,对频谱特征序列中的后期混响特征进行实时过滤,本发明仅对后期这种强烈的混响进行了抑制,并不抑制前期反射,能够做到适量的混响抑制,混响抑制后的声音听觉效果较好。
上述技术方案的基础上,本发明还可以做如下改进。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010023100.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:蓄电池组和具有蓄电池组的地面处理设备
- 下一篇:多模生物特征融合方法和系统





