[发明专利]语音增强优化方法及语音增强优化系统、可读存储介质在审
申请号: | 202011581295.8 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112652324A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 萧博耀 | 申请(专利权)人: | 深圳万兴软件有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L21/0272 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黄广龙 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 优化 方法 系统 可读 存储 介质 | ||
本申请公开了一种语音增强优化方法及语音增强优化系统、可读存储介质。本申请的语音增强优化方法,包括:获取音频数据信息;对所述音频数据信息进行音频分离处理,以得到背景噪音段数据;对所述背景噪音段数据进行频谱特性估计处理,得到噪音频谱;根据所述噪音频谱对所述音频数据信息进行降噪处理,得到目标音频。本申请所提供的语音增强优化方法通过对音频数据信息进行音频分离处理,并对得到的背景噪音段数据进行频谱特征估计,以得到用于表征噪音分布特征的噪音频谱。
技术领域
本申请涉及语音处理技术领域,尤其涉及一种语音增强优化方法及语音增强优化系统、计算机可读存储介质。
背景技术
在相关技术中,由于录音环境、录音设备的影响导致语音录音中背景噪音,而背景噪音的存在容易影响使用者对语音录音的整体感知、理解程度。
例如,通过手动降噪的方式对语音录音中没有语音的背景噪音部份进行框选,并通过对背景噪音部份进行噪音特性估计以对语音录音进行手动降噪。然而,一般的噪音特性估计方式需要通过使用者手动对背景噪音提取,以对语音录音进行降噪处理。
发明内容
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种语音增强优化方法及语音增强优化系统、可读存储介质,本申请所提供的语音增强优化方法通过对音频数据信息进行音频分离处理,并对得到的背景噪音段数据进行频谱特征估计,以得到用于表征噪音分布特征的噪音频谱。
本申请实施例第一方面提供一种语音增强优化方法,包括:
获取音频数据信息;
对所述音频数据信息进行音频分离处理,以得到背景噪音段数据;
对所述背景噪音段数据进行频谱特性估计处理,得到噪音频谱;
根据所述噪音频谱对所述音频数据信息进行降噪处理,得到目标音频。
本申请实施例中语音增强优化方法包括如下技术效果:通过对音频数据信息进行音频分离处理,并对得到的背景噪音段数据进行频谱特征估计,以得到用于表征噪音分布特征的噪音频谱。根据噪音频谱对整个音频数据信息进行降噪处理,以使得目标音频更加接近于纯净的无噪音录音,从而简化背景噪音段数据的提取步骤。
在一些实施例中,所述对所述音频数据信息进行音频分离处理,以得到所述背景噪音段数据,包括:
对所述音频数据信息进行初步检测处理,生成语音检测原始标签;
对所述语音检测原始标签进行保持时间处理,生成语音检测处理标签;
对所述语音检测处理标签进行侦测确保处理,生成语音检测扩展标签;
对所述语音检测扩展标签进行反向侦测处理,生成背景音标签;
根据所述背景音标签对所述音频数据信息进行音频分离处理得到所述背景噪音段数据。在一些实施例中,所述对所述音频数据信息进行初步检测处理,生成语音检测原始标签,还包括:
对所述音频数据信息进行分帧处理、加窗处理,得到音频子数据信息;对所述音频子数据信息进行对数倒頻譜处理,得到音频对数倒頻譜;根据预设阈值、所述音频对数倒頻譜,生成所述语音检测原始标签。
在一些实施例中,所述对所述音频子数据信息进行对数倒頻譜处理,得到音频对数倒頻譜,还包括:
对所述音频子数据信息进行傅里叶变换处理、平方处理,并得到第一变换数据;对所述第一变换数据进行对数处理、逆傅里叶变换处理,并得到第二变换数据;对所述第二变换数据进行平方处理、倒数处理得到所述音频对数倒頻譜。
在一些实施例中,所述对所述语音检测原始标签进行保持时间处理,生成语音检测处理标签,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳万兴软件有限公司,未经深圳万兴软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011581295.8/2.html,转载请声明来源钻瓜专利网。