[发明专利]应用于麦克风阵列的语音增强方法有效
| 申请号: | 201810225373.7 | 申请日: | 2018-03-19 |
| 公开(公告)号: | CN108447498B | 公开(公告)日: | 2022-04-19 |
| 发明(设计)人: | 叶中付;贾翔宇;童仁杰 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
| 代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 杨学明;卢纪 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 应用于 麦克风 阵列 语音 增强 方法 | ||
本发明公开了一种应用于麦克风阵列的语音增强方法,包括:将接收到的麦克风阵列多路语音数据信号表示成张量形式,利用时间、频率和通道三个物理量把信号建模成一个三阶张量;采用张量分解方法建立多模滤波器,通过时域、频域和空域三个滤波器分别对带噪的多路语音数据信号进行迭代滤波,从而恢复出期望的干净的多路语音数据信号,实现语音信号的增强。
技术领域
本发明涉及语音降噪技术领域,尤其涉及一种在高维空间中利用张量模型解决麦克风阵列信号的语音增强方法。
背景技术
人们已经提出了若干单麦克风的语音降噪算法,包括谱减法、维纳滤波算法和卡尔曼滤波算法等,这些单麦克风降噪算法由于其简单快速并可以在一定程度上抑制噪声,而得到广泛的应用。与单麦克风的降噪算法相比,基于麦克风阵列的语音增强算法可以同时获得接收语音信号的时域和空域信息,算法上也能更加灵活的利用这样的多维信息提高降噪性能。近年来张量分析理论不断完善,实现了在高维空间中通过张量工具解决信号处理问题。基于张量分析的方法一般把接收的多路数据表示成张量形式,或者叫多维矩阵,每一维可以是基本物理量如时间、频率、宽度、高度和通道等。在研究中,多路数据被认为是一个不可分隔的张量整体,模型很自然需要用到多重线性代数这样的信号处理技术特别是张量分解和张量近似方法,这种理论尤其适合于处理多路麦克风语音信号,因此张量在阵列语音信号降噪系统中的应用也是一个值得研究的课题。在本文的麦克风阵列语音信号处理中,我们可以通过时间、频率和通道三个物理量把接收到的语音信号建模成一个三阶张量。
发明内容
本发明的目的是提供一种应用于麦克风阵列的语音增强方法,与传统的波束形成方法相比,该算法利用到接收的多通道信号的时间、频率和通道三个物理量将其表示为一个三阶张量,因而能够更加明显地去除空间白噪声和特定的方向性噪声,并尽可能地无失真恢复出期望的干净语音。
本发明的目的是通过以下技术方案实现的:
一种应用于麦克风阵列的语音增强方法,包括:
步骤一、基于张量分析理论,将接收到的麦克风阵列多路语音数据信号表示成张量形式,利用到时间、频率和通道三个物理量把信号建模成一个三阶张量;
步骤二、采用张量分解方法获得对应的多模滤波器,通过时域、频域和空域三个滤波器分别对原始带噪的多路语音数据信号进行迭代滤波,恢复出期望的干净的多路语音数据信号,实现对语音数据信号的增强。
上述步骤一中,基于张量分析理论,将接收到的麦克风阵列多路语音数据信号表示成张量形式,利用时间、频率和通道三个物理量把信号建模成一个三阶张量;基于张量分析的信号处理方法扩展了低维空间的信号处理方法。假设原始的干净的多路语音数据信号用张量表示,当其叠加上干扰噪声时,会得到带噪的多路语音数据信号
也就是:
其中,F表示频率点个数,与物理量频率对应;N表示分段语音的帧数,与物理量时间对应;I表示麦克风数目,与物理量通道对应;
上述步骤二中,我们的目标就是用多维滤波器估计原始干净的多路语音数据信号
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810225373.7/2.html,转载请声明来源钻瓜专利网。





