[发明专利]一种麦克风阵列语音增强方法及实现装置有效
申请号: | 201910677433.3 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110517701B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 张军;梁晟;宁更新;冯义志;余华;季飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216;G10L25/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蒋剑明 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 麦克风 阵列 语音 增强 方法 实现 装置 | ||
本发明公开了一种麦克风阵列语音增强方法及实现装置,通过支路三来抑制说话人和干扰源方向的信号,得到空间非相干噪声频谱矢量;使用深度神经网络来完成从带噪语音和噪声到干净语音的映射,可以有效地利用语音信号的非线性特性和时间相关性,使估计结果更精确和接近人类听觉特性;该深度神经网络采用带噪语音和噪声作为输入,与传统仅采用带噪语音作为输入的深度神经网络语音增强技术相比具有更好的增强效果。本发明将基于麦克风阵列和深度神经网络的语音增强技术相结合,性能优于传统的麦克风阵列语音增强方法和单麦克风深度神经网络语音增强方法;可以广泛用于视频会议、车载通信、会场、多媒体教室等各种具有嘈杂背景的语音通信应用中。
技术领域
本发明涉及语音信号处理技术领域,具体涉及一种基于深度神经网络(DNN)的麦克风阵列语音增强方法及实现装置。
背景技术
在现实生活中,人们传递语音信息的过程常常不可避免会受到外界噪声的干扰,这些干扰会令语音质量下降,影响语音通信和识别的效果。语音增强是一种从受噪声干扰的语音中提取有用的语音信号、抑制和降低噪声的技术,即从含噪语音中提取尽可能纯净的原始语音,在语音通信、语音识别等方面有着广泛的用途。
根据所使用麦克风的数目,现有的语音增强算法可以分为两类,一类是基于单麦克风的语音增强算法,例如谱减法、维纳滤波法、MMSE、卡尔曼滤波等。这类语音增强算法使用单个麦克风来接收声音信号,体积小,结构简单,但降噪能力有限,大多只能处理平稳噪声,对于非平稳噪声效果语音增强的效果并不理想。另一类是基于麦克风阵列的语音增强,即在声音采集系统中使用多个麦克风来接收来自于不同空间方向的声音,通过空域滤波来放大说话人方向的信号,抑制其他方向的噪声和干扰,与传统的方法相比具有更高的信号增益和更强的干扰抑制能力,可以解决多种声学估计问题,如声源定位、去混响、语音增强、盲源分离等,缺点是体积大,算法复杂度较高。现有的麦克风阵列语音增强技术可以大致分为固定波束形成法、自适应波束形成法和后置自适应滤波法三类,其中自适应波束形成是在某种最优准则下通过自适应算法来调节和优化阵列权重,对环境的变化具有较好的适应能力,因此在实际中应用得最为广泛。
广义旁瓣抵消器(GSC)是实现自适应波束的一种常用结构,主要由两条支路构成:支路一采用固定波束形成器增强接收方向的信号,支路二首先采用阻塞矩阵阻止接收方向的信号通过,然后采用自适应滤波器对阻塞矩阵的输出进行滤波,以估计出支路一输出中残留的噪声,并通过相减抵消。GSC可以将受限的线性约束最小方差(LCMV)最优化问题转化为非约束最优化问题,因此具有很高的计算效率,实现起来比其他自适应波束形成算法更简单。但传统的GSC还存在着一些不足,例如:对空间非相干噪声抑制能力不强,没有利用语音信号的先验知识并针对语音信号的特点进行优化等。
为了解决上述问题,中国发明专利201711201341.5提供了一种基于统计模型的麦克风阵列语音增强方法,该方法利用干净语音模型和从GSC支路二输出中估计的噪声模型构造最佳语音滤波器来对GSC支路一的输出信号进行增强,能有效提高增强系统对非相干噪声的抑制能力,并能利用语音信号的先验知识来使输出语音更符合人类的听觉特性。但该方法还存在着以下缺点:(1)该方法使用自适应滤波器输出信号能量和自适应滤波器M-1路输入信号能量之和的比例来调整非相干噪声的更新速率,在相干噪声和非相干噪声同时存在时难以准确估计和跟踪非相干噪声,因而影响了噪声抑制的效果;(2)该方法使用线性滤波器来对固定波束形成部分的输出进行增强,在消除噪声的同时会带来语音信号的失真,使增强效果受到较大的限制;(3)在语音增强处理过程中,前后语音帧的处理相互独立,无法利用语音信号在时间上的相关性。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910677433.3/2.html,转载请声明来源钻瓜专利网。