[发明专利]一种基于二阶微分麦克风阵列的语音增强算法在审
申请号: | 201910275383.6 | 申请日: | 2019-04-08 |
公开(公告)号: | CN110310650A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 李冬梅;辜君龙;刘润生 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 廖元秋 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 掩蔽 麦克风阵列 时频单元 二阶 语音增强算法 目标语音 听觉场景 语音信号 语音 分帧 波束形成算法 波束形成信号 逆傅里叶变换 语音信号处理 波束形成 分析算法 平滑处理 微分算法 应用场景 语音合成 噪声波束 噪声能量 增强信号 平滑 加窗 相加 采集 优化 分析 | ||
本发明提出一种基于二阶微分麦克风阵列的语音增强算法,属于语音信号处理领域。该方法首先搭建麦克风阵列并采集说话人语音的3路语音信号,使用二阶微分算法提取目标语音波束形成信号和噪声波束形成信号并分帧分频带,任意选取一路语音信号分帧分频带,计算每个时频单元的掩蔽值并进行平滑处理,得到每个时频单元增强后的语音的时频单元值;最后通过逆傅里叶变换,加窗并重叠相加得到说话人语音对应的增强信号。该方法结合波束形成算法与计算听觉场景分析算法,将波束形成结果仅作为目标语音和噪声能量的估计,并对计算听觉场景分析中掩蔽值产生过程进行了优化,使得掩蔽值更加平滑适宜于实际应用场景,使得最终语音合成后增强效果明显。
技术领域
本发明属于数字语音信号处理领域,具体涉及一种基于二阶微分麦克风阵列的语音增强算法。
背景技术
随着电子信息技术的发展,语音信号处理技术在语音交互系统中得到广泛应用。而由于日常环境中存在的各种噪声,使得语音处理的质量受到很大影响,主要体现在语音识别率的下降和可懂度的下降。因此在语音信号处理中,需要通过语音增强技术进行预处理,去除语音中的噪声和干扰,从而提高语音处理的质量。
基于二阶微分麦克风阵列的语音增强算法更利于实现具有良好指向性的语音降噪效果。其中主要利用到波束形成算法和计算听觉场景分析算法。
二阶微分麦克风阵列波束形成算法通常假定目标声源方向已知,通过对其他非目标声源方向的声音信号进行不同程度的衰减,从而完成指定方向上的语音增强,相比一阶算法而言指向性更强。假设声音以θ角方向入射到麦克风阵列,若信号强度为P0,则t=0时刻,第一个麦克风接收的信号为E1=P0,第二个麦克风接收的信号为E2(ω,θ)=P0e-jωdcosθ/c,第三个麦克风接收的信号为E3(ω,θ)=e-jω(d+d′)cosθ/c。其中,ω为圆频率,d和d’为相邻的麦克风的距离,c为声速。其原理如图1所示。
将三个麦克风排列成为一条直线,选取其中相邻的两对(每相邻的两个麦克风构成一对)构成两个一阶微分麦克对,将每一对中的其中一个信号延时τ1(第一延时参数)后与另一个信号相减,以此方法分别计算每个一阶微分麦克对对应的一阶延时微分信号,将这两个一阶延时差分信号中的任意一个再延时τ2(第二延时参数)后与另一个一阶延时差分信号相减,做二阶微分,将输出信号变换到频域进行处理,类似于一阶微分麦克阵列的分析方法可以得到如下分析过程:
将第一个麦克风的信号与第二个麦克风经过τ1的延时信号相减得到:
E12(ω,θ)≈P0ω(τ1+dcosθ/c) (1-2)
同理,将第二个麦克风的信号与第三个麦克风经过τ'1的延时信号相减得到:
E23(ω,θ)≈P0ω(τ1’+d‘cosθ/c)e-jωdcosθ/c (1-4)
由E12表达式可以看出,在一阶差分麦克阵列中延时相减的信号角频率作为表达式中的一个因子使信号不同的频率分量具有不同的增益,为保证经过差分的信号不失真,需要加一个频响为1/ω的低通滤波器消除角频率因子对频率分量的作用。在二阶微分麦克阵列中,进一步计算二阶微分结果为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910275383.6/2.html,转载请声明来源钻瓜专利网。