[发明专利]语音增强方法在审

专利信息
申请号: 201810827229.0 申请日: 2018-07-25
公开(公告)号: CN110767244A 公开(公告)日: 2020-02-07
发明(设计)人: 杜俊;高天;屠彦辉;王立众;杨磊;徐学淼 申请(专利权)人: 中国科学技术大学;北京三星通信技术研究有限公司
主分类号: G10L21/02 分类号: G10L21/02;G10L21/0208;G10L25/30
代理公司: 11260 北京凯特来知识产权代理有限公司 代理人: 郑立明;郑哲
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 声学特征 掩蔽 神经网络模型 双输出 语音帧 人耳 重构 语音 应用 语音识别系统 干净语音 输入语音 语音增强 噪声语音 增强处理 提升带 准确率 降噪 样本 观测
【说明书】:

发明公开了一种语音增强方法,包括:提取各语音帧的声学特征;利用干净语音的与噪声语音的样本对渐进式双输出神经网络模型进行训练,利用训练后的渐进式双输出神经网络模型估计各语音帧的理想软掩蔽,并进行声学特征的增强处理;如果应用到人耳,则利用增强后的声学特征对波形进行重构,得到可主观测听的波形;如果应用到语音识别系统,则将估计到的理想软掩蔽应用到输入语音的声学特征上上,得到掩蔽后的声学特征,然后对波形进行重构得到增强后的语音。本发明上述方案可以满足人耳降噪需求和提升带噪语音的识别准确率。

技术领域

本发明涉及语音处理技术领域,尤其涉及一种语音增强方法。

背景技术

语音识别是让机器听懂人说的话,也就是要将人类语音中的词汇内容转化为计算机可以识别的输入。近20年来,尤其是近几年深度学习的引入,使得语音识别技术取得了显著成效,开始从实验室走向市场。目前基于语音识别技术的语音输入,语音检索,语音翻译等得到了广泛的运用。众所周知,在噪声环境下如果我们不采取任何措施,那么自动语音识别的性能就会大幅下降,主要原因就是带噪语音分布于声学模型分布之间的差异。为了提高噪声环境下的识别准确率,语音增强算法通常用语音识别的前处理,其通过变换将带噪语音尽可能恢复到干净状态来匹配声学模型分布。

语音增强是语音信号处理领域的一个重要分支,早在对语音信号研究的起初,噪声就已经是一个被关注的问题,因为在现实生活环境中,语音都伴随着受噪声的干扰而产生。而语音信号处理一般只对语音的内容、说话人、语种等感兴趣,噪声作为干扰项,一般都需要预先被去除掉,但是考虑到语音和噪声的产生过程是非线性的和复杂的,因而去噪的过程很困难。在过去的几十年中,有很多无监督的语音增强方法被提出,它们都是通过先估计噪声的谱信息,然后从带噪语谱中将估计的噪声谱减掉以得到对干净语音谱的预测。但是由于噪声的随机性和突变性,让对噪声的跟踪和估计变得困难。同时在传统的语音增强方法中,考虑到噪声和语音间的相互作用关系很复杂,就需要一些对信号间的独立性假设以及对特征分布的高斯性假设。由于这些假设的存在,首先就导致了传统的语音增强方法残留很多噪声,甚至是音乐噪声。其次,语音的细节也在较大程度上受到破坏,这主要体现在对低信噪比语音的增强中。再者,极端非平稳噪声一直是传统语音增强方法中比较棘手的地方,因为非平稳噪声的突发性,使得它始终处于被欠估计状态,难以从带噪语音中去掉,可实际声学环境中,各种非平稳噪声又是大概率发生事件。最后,传统的语音增强方法易引入一些非线性失真,使得其对后端的语音识别产生破坏作用。

谱减法是最经典的语音增强算法之一,最开始用于语音增强,后来逐步用到语音识别中。此方法分为噪声更新和噪声消除两部分。在噪声更新时,首先需要确定检测出非语音段,然后利用当前帧和历史长时信息结合的方法来估计出噪声谱,由于长时平均的存在,需要假设噪声是慢变的,因此在快变的非稳态噪声的情况下,谱减法就不起作用。在噪声消除时,通过从带噪语音谱中减去估计的噪声谱来得到干净语音谱的估计。由于谱减法存在过减的问题,需要在每个频带设置一个和信噪比相关的过减因子。谱减法的非线性操作会在增强的信号中产生残留的音乐噪声,在实际应用中要采用一些特定的解决方案。此外,一个可靠的语音/非语音检测模块也是至关重要的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学;北京三星通信技术研究有限公司,未经中国科学技术大学;北京三星通信技术研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810827229.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top