[发明专利]一种麦克风阵列语音增强方法及实现装置有效

申请号：	201910677433.3	申请日：	2019-07-25
公开（公告）号：	CN110517701B	公开（公告）日：	2021-09-21
发明（设计）人：	张军;梁晟;宁更新;冯义志;余华;季飞	申请（专利权）人：	华南理工大学
主分类号：	G10L21/02	分类号：	G10L21/02;G10L21/0216;G10L25/30
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	蒋剑明
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种麦克风阵列语音增强方法及实现装置，通过支路三来抑制说话人和干扰源方向的信号，得到空间非相干噪声频谱矢量；使用深度神经网络来完成从带噪语音和噪声到干净语音的映射，可以有效地利用语音信号的非线性特性和时间相关性，使估计结果更精确和接近人类听觉特性；该深度神经网络采用带噪语音和噪声作为输入，与传统仅采用带噪语音作为输入的深度神经网络语音增强技术相比具有更好的增强效果。本发明将基于麦克风阵列和深度神经网络的语音增强技术相结合，性能优于传统的麦克风阵列语音增强方法和单麦克风深度神经网络语音增强方法；可以广泛用于视频会议、车载通信、会场、多媒体教室等各种具有嘈杂背景的语音通信应用中。
搜索关键词：	一种麦克风阵列语音增强方法实现装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度神经网络的麦克风阵列语音增强方法，其特征在于，采用以下步骤对输入的语音信号进行增强：/nS1、使用干净语音库和噪声库训练用于将带噪语音和噪声映射为干净语音的深度神经网络；/nS2、使用麦克风阵列估计说话人的来波方向、干扰源的数目和干扰源的来波方向；/nS3、将麦克风阵列接收的信号分为三条支路，支路一采用固定波束形成器对说话人方向的信号进行增强，得到支路一输出的语音频谱S^(f)(ω,t)，其中t为帧序号；支路二采用阻塞矩阵B₁抑制说话人方向的信号，并将阻塞矩阵的输出通过自适应滤波器，得到支路二输出的噪声分量频谱支路三采用阻塞矩阵B₂抑制说话人和所有干扰源方向的信号，得到支路三输出的空间非相干噪声的频谱矢量/nS4、使用和估计S^(f)(ω,t)中包含的噪声频谱/nS5、将S^(f)(ω,t)和输入步骤S1中训练的深度神经网络，得到增强后的语音。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910677433.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种麦克风阵列语音增强方法及实现装置有效

专利文献下载