[发明专利]一种麦克风阵列语音增强方法及实现装置有效
申请号: | 201910677433.3 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110517701B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 张军;梁晟;宁更新;冯义志;余华;季飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216;G10L25/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蒋剑明 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种麦克风阵列语音增强方法及实现装置,通过支路三来抑制说话人和干扰源方向的信号,得到空间非相干噪声频谱矢量;使用深度神经网络来完成从带噪语音和噪声到干净语音的映射,可以有效地利用语音信号的非线性特性和时间相关性,使估计结果更精确和接近人类听觉特性;该深度神经网络采用带噪语音和噪声作为输入,与传统仅采用带噪语音作为输入的深度神经网络语音增强技术相比具有更好的增强效果。本发明将基于麦克风阵列和深度神经网络的语音增强技术相结合,性能优于传统的麦克风阵列语音增强方法和单麦克风深度神经网络语音增强方法;可以广泛用于视频会议、车载通信、会场、多媒体教室等各种具有嘈杂背景的语音通信应用中。 | ||
搜索关键词: | 一种 麦克风 阵列 语音 增强 方法 实现 装置 | ||
【主权项】:
1.一种基于深度神经网络的麦克风阵列语音增强方法,其特征在于,采用以下步骤对输入的语音信号进行增强:/nS1、使用干净语音库和噪声库训练用于将带噪语音和噪声映射为干净语音的深度神经网络;/nS2、使用麦克风阵列估计说话人的来波方向、干扰源的数目和干扰源的来波方向;/nS3、将麦克风阵列接收的信号分为三条支路,支路一采用固定波束形成器对说话人方向的信号进行增强,得到支路一输出的语音频谱S(f)(ω,t),其中t为帧序号;支路二采用阻塞矩阵B1抑制说话人方向的信号,并将阻塞矩阵的输出通过自适应滤波器,得到支路二输出的噪声分量频谱 支路三采用阻塞矩阵B2抑制说话人和所有干扰源方向的信号,得到支路三输出的空间非相干噪声的频谱矢量 /nS4、使用 和 估计S(f)(ω,t)中包含的噪声频谱 /nS5、将S(f)(ω,t)和 输入步骤S1中训练的深度神经网络,得到增强后的语音。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910677433.3/,转载请声明来源钻瓜专利网。