[发明专利]一种语音去噪方法、装置、电子设备及存储介质在审
| 申请号: | 202010421248.0 | 申请日: | 2020-05-18 |
| 公开(公告)号: | CN111754983A | 公开(公告)日: | 2020-10-09 |
| 发明(设计)人: | 邹佳宏 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L21/0232 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
| 地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种语音去噪方法、装置、电子设备及存储介质,该方法包括:获取待去噪语音数据;提取待去噪语音数据的频谱图信息;将频谱图信息输入到预先训练好的神经网络模型中,得到频谱图信息对应的信噪比,其中,神经网络模型是基于标注有已知噪音数据的样本语音数据的样本频谱图信息和样本频谱图信息对应的样本信噪比训练得到的;基于频谱图信息对应的信噪比对待去噪语音数据进行去噪处理,得到去噪后的语音数据。训练神经网络模型时,所采用的样本语音数据中的噪音数据是已知的,从而训练后的神经网络模型可以准确地确定待去噪语音数据的频谱图信息对应的信噪比,且在不同语音环境中具有很强的鲁棒性,进而可以大大提高语音去噪效果。
技术领域
本申请涉及语音识别技术领域,特别是涉及一种语音去噪方法、装置、电子设备及存储介质。
背景技术
随着科技的不断发展,语音识别已经进入了人们生活的方方面面,例如语音助手和智能音箱等。但是,由于环境中噪音的存在,严重影响了语音识别的准确性。为了更好的提升语音识别的性能,需要有相应的语音去噪方法予以支持。
相关技术中的语音去噪方法一般是基于语音中各频段的功率和噪声功率的比值计算各频段的噪声抑制因子,以将各频段的幅值乘以对应的噪音抑制因子,从而达到语音去噪的目的。
但是,由于噪音的多样性,相关技术无法准确地确定一段语音中包含哪些种类噪音,以及噪音的频谱和噪音在语音中的位置,从而导致信噪比计算不准确,进而严重影响语音去噪效果。
发明内容
为了解决相关技术存在的因无法准确地判断一段语音中包含哪些种类噪音,以及噪音的频谱和噪音在语音中的位置,从而导致信噪比计算不准确,进而严重影响语音去噪效果的技术问题。本申请实施例提供了一种语音去噪方法、装置、电子设备及存储介质。
第一方面,本申请示出了一种语音去噪方法,所述方法包括:
获取待去噪语音数据;
提取所述待去噪语音数据的频谱图信息;
将所述频谱图信息输入到预先训练好的神经网络模型中,得到所述频谱图信息对应的信噪比,其中,所述神经网络模型是基于标注有已知噪音数据的样本语音数据的样本频谱图信息和所述样本频谱图信息对应的样本信噪比训练得到的;
基于所述频谱图信息对应的信噪比对所述待去噪语音数据进行去噪处理,得到去噪后的语音数据。
可选的,所述神经网络模型的训练过程包括:
获取样本语音数据,其中,所述样本语音数据是将无噪音的语音数据与已知噪音数据混合所得到的语音数据;
提取所述样本语音数据的样本频谱图信息,并计算所述样本频谱图信息对应的信噪比;
将所述样本频谱图信息输入预设模型中,对所述预设模型进行训练,直至从所述预设模型输出的信噪比为所述样本频谱图信息对应的信噪比时,将所述训练后的预设模型确定为所述神经网络模型。
可选的,所述提取所述待去噪语音数据的频谱图信息,包括:
将所述待去噪语音数据进行短时傅里叶变换,得到所述待去噪语音数据的频谱图信息,其中,所述频谱图信息包括幅度和相位。
可选的,所述基于所述频谱图信息对应的信噪比,对所述待去噪语音数据进行去噪处理,得到去噪后的语音数据,包括:
根据所述频谱图信息对应的信噪比和所述频谱图信息所包括的幅度,计算所述去噪后的语音数据的幅度;
将所述去噪后的语音数据的幅度和所述频谱图信息所包括的相位进行反短时傅里叶变换,得到去噪后的语音数据。
第二方面,本申请示出了一种语音去噪装置,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010421248.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型聚氨酯保温装饰一体板
- 下一篇:一种文本检测方法和装置





