[发明专利]基于麦克风阵列的语音增强方法及系统有效

申请号：	201910823446.7	申请日：	2019-09-02
公开（公告）号：	CN110544486B	公开（公告）日：	2021-11-02
发明（设计）人：	张南雄;李宏斌	申请（专利权）人：	上海其高电子科技有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216
代理公司：	上海交达专利事务所 31201	代理人：	王毓理;王锡麟
地址：	200090 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于麦克风阵列语音增强方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种基于麦克风阵列的语音增强方法及系统，根据视频图像校准各个麦克风之间的相对传递函数，通过声压分布图获得监视范围内的噪声分布情况并对应采用语音增强算法或噪声抑制算法对麦克风阵列采集到的信号进行合并处理，最后利用基于最小p范数算法的均衡器处理得到增强后的语音信号。能够进行多通道的麦克风语音增强和降噪的同时可脱离计算机单独运行，便于实施伪装。

技术领域

本发明涉及的是一种语音处理领域的技术，具体是一种基于麦克风阵列的语音增强方法及系统。

背景技术

现有的语音增强方案大多是基于少量麦克风实现的。常见的如基于唤醒词的智能音箱，这类应用的使用场合较为固定，且环境噪声较小。而在侦听领域中，侦听对象距离较远，语音信号信噪比迅速降低，再考虑到环境噪声及混响等因素，采用普通的麦克风阵列语音处理技术通过波束成形等方式进行远场语音增强的性能并不理想。

一些改进技术通过对GSC的固定波束通路增加一个自适应处理器改善信号通道的信噪比，借助频域时延估计来补偿各通道时延，以使得波束对准声源方向。但这类技术的增强效果将在部分语音信号成分泄漏到参考噪声通路时受到大幅度影响。

发明内容

本发明针对现有技术存在的上述不足，提出一种基于麦克风阵列的语音增强方法及系统。

本发明是通过以下技术方案实现的：

本发明涉及一种基于麦克风阵列的语音增强方法，根据视频图像校准各个麦克风之间的相对传递函数(RTF)，通过声压分布图获得监视范围内的噪声分布情况并对应采用语音增强算法或噪声抑制算法对麦克风阵列采集到的信号进行合并处理，最后利用基于最小p范数算法的均衡器处理得到增强后的语音信号。

所述的相对传递函数包括各个麦克风之间的相位误差以及由当前系统工作环境所引入的相位误差。

所述的合并处理是指：将经语音增强或噪声抑制算法后各个麦克风采集到的信号降为单通道信号后采用均衡器滤波以得到听感优化的最终语音信号。

本发明涉及实现上述方法的系统，包括：用于采集场景中的音频及视频信号的语音信号音视频采集模块、用于搜寻场景中噪声来源的声源定位模块、用于对采集到的音频信号进行噪声抑制和语音增强的语音增强与抑制模块、用于对语音增强后的信号进行频域均衡以提高语音信号清晰度的均衡器。

所述的系统进一步设有通过有线网络或无线网络的方式传输数据或信号处理结果的数据传输模块以及用于数据保存的数据存储模块。

所述的系统进一步设有用于将语音增强与抑制模块处理后的结果进行播放的声音播放模块。

所述的系统进一步设有用于控制本系统的电池充放电及电量监测的电源管理模块。

所述的声源定位模块包括：声源定位单元、声源分布累加单元、重置累加单元及判决单元，其中：声源定位单元通过波束成型的算法将波束成型的结果传输至声源分布累加单元，声源分布累加单元再未收到重置命令前不断累加声源定位单元发送来的结果，重置累加单元通过声源分布累加单元当前累加的声压的分布情况输出至判决单元，判决单元根据判据通知语音增强与抑制模块使用增强算法或使用噪声抑制算法。

所述的判据为：当声压分布情况显示只有一个声源，且声压最大值与最小值的差大于6dB，则优选噪声抑制算法；反之，当声压分布情况显示无明显的声源且声源最大值与最小值差小于6dB，则优选语音增强算法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海其高电子科技有限公司，未经上海其高电子科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910823446.7/2.html，转载请声明来源钻瓜专利网。

上一篇：一种利用CNN的SE-ED网络进行远场语音去混响的方法
下一篇：基于麦克风的语音检测方法及装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于麦克风阵列的语音增强方法及系统有效

专利文献下载