[发明专利]应用于麦克风阵列的语音增强方法有效

申请号：	201810225373.7	申请日：	2018-03-19
公开（公告）号：	CN108447498B	公开（公告）日：	2022-04-19
发明（设计）人：	叶中付;贾翔宇;童仁杰	申请（专利权）人：	中国科学技术大学
主分类号：	G10L21/0216	分类号：	G10L21/0216
代理公司：	北京科迪生专利代理有限责任公司 11251	代理人：	杨学明;卢纪
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	应用于麦克风阵列语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种应用于麦克风阵列的语音增强方法，包括：将接收到的麦克风阵列多路语音数据信号表示成张量形式，利用时间、频率和通道三个物理量把信号建模成一个三阶张量；采用张量分解方法建立多模滤波器，通过时域、频域和空域三个滤波器分别对带噪的多路语音数据信号进行迭代滤波，从而恢复出期望的干净的多路语音数据信号，实现语音信号的增强。

技术领域

本发明涉及语音降噪技术领域，尤其涉及一种在高维空间中利用张量模型解决麦克风阵列信号的语音增强方法。

背景技术

人们已经提出了若干单麦克风的语音降噪算法，包括谱减法、维纳滤波算法和卡尔曼滤波算法等，这些单麦克风降噪算法由于其简单快速并可以在一定程度上抑制噪声，而得到广泛的应用。与单麦克风的降噪算法相比，基于麦克风阵列的语音增强算法可以同时获得接收语音信号的时域和空域信息，算法上也能更加灵活的利用这样的多维信息提高降噪性能。近年来张量分析理论不断完善，实现了在高维空间中通过张量工具解决信号处理问题。基于张量分析的方法一般把接收的多路数据表示成张量形式，或者叫多维矩阵，每一维可以是基本物理量如时间、频率、宽度、高度和通道等。在研究中，多路数据被认为是一个不可分隔的张量整体，模型很自然需要用到多重线性代数这样的信号处理技术特别是张量分解和张量近似方法，这种理论尤其适合于处理多路麦克风语音信号，因此张量在阵列语音信号降噪系统中的应用也是一个值得研究的课题。在本文的麦克风阵列语音信号处理中，我们可以通过时间、频率和通道三个物理量把接收到的语音信号建模成一个三阶张量。

发明内容

本发明的目的是提供一种应用于麦克风阵列的语音增强方法，与传统的波束形成方法相比，该算法利用到接收的多通道信号的时间、频率和通道三个物理量将其表示为一个三阶张量，因而能够更加明显地去除空间白噪声和特定的方向性噪声，并尽可能地无失真恢复出期望的干净语音。

本发明的目的是通过以下技术方案实现的：

一种应用于麦克风阵列的语音增强方法，包括：

步骤一、基于张量分析理论，将接收到的麦克风阵列多路语音数据信号表示成张量形式，利用到时间、频率和通道三个物理量把信号建模成一个三阶张量；

步骤二、采用张量分解方法获得对应的多模滤波器，通过时域、频域和空域三个滤波器分别对原始带噪的多路语音数据信号进行迭代滤波，恢复出期望的干净的多路语音数据信号，实现对语音数据信号的增强。

上述步骤一中，基于张量分析理论，将接收到的麦克风阵列多路语音数据信号表示成张量形式，利用时间、频率和通道三个物理量把信号建模成一个三阶张量；基于张量分析的信号处理方法扩展了低维空间的信号处理方法。假设原始的干净的多路语音数据信号用张量表示，当其叠加上干扰噪声时，会得到带噪的多路语音数据信号Y，表示如下：

也就是：

其中，F表示频率点个数,与物理量频率对应；N表示分段语音的帧数，与物理量时间对应；I表示麦克风数目,与物理量通道对应；Y(f,n,i)表示第i个麦克风接收通道中的第n帧的第f个元素；因此在这个模型中，X和N分别代表目标语音部分和噪声部分，都是三阶的张量,这里的噪声可以是高斯白噪声，也可以是色噪声，也可以是两者的混合。

上述步骤二中，我们的目标就是用多维滤波器估计原始干净的多路语音数据信号X：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学技术大学，未经中国科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810225373.7/2.html，转载请声明来源钻瓜专利网。

上一篇：一种在有干扰的环境中独立出自己发声的方法
下一篇：一种双层圆环麦克风阵列语音增强方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]应用于麦克风阵列的语音增强方法有效

专利文献下载