[发明专利]一种双麦克风语音增强方法和系统有效
申请号: | 202310123145.X | 申请日: | 2023-02-16 |
公开(公告)号: | CN115831145B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 白炳潮;宛敏红;宋伟;朱世强 | 申请(专利权)人: | 之江实验室 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L21/0264;G10L25/21 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
地址: | 311100 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 麦克风 语音 增强 方法 系统 | ||
1.一种双麦克风语音增强方法,其特征在于,包括以下步骤:
步骤一,对两个麦克风通道的信号进行分帧,加窗,快速傅里叶变换的操作,使得信号从时域转换到频域;
步骤二,利用互相关函数对两个通道在频域的信号进行语音活跃检测,若检测为无语音段,则更新噪声互功率谱;若检测为有语音段,则对语音信号进行降噪处理;
步骤三,使用降噪后的语音信号来估计晚期混响功率谱,并抑制混响,即使用晚期混响功率谱对降噪后的语音信号做去混响处理;
步骤四,将降噪去混响后的信号从频域转换回时域后输出;
所述步骤一,具体为:先对输入的双麦克风即两个通道的时域信号进行分帧,得到分帧后时域信号yi(m,l),利用快速傅里叶变换将两个麦克风的时域信号转换到频域,频域信号表达式为:其中i表示第i个麦克风即i通道,m表示第m个采样点,l表示第l帧,h(m)表示窗函数;k表示频域第k个频点,K表示频域的频点数,j为虚数单位,w表示角频率,wk即表示第k个角频率;
所述步骤二,具体包括以下子步骤:
步骤2.1,计算两个通道的自功率谱和互功率谱;
步骤2.2,计算互相关函数均值;
步骤2.3,利用互相函数均值和预先设定门限判断语音是否活跃,即:根据互相关函数均值是否大于预设阈值,来判断语音是否活跃;
步骤2.4,更新噪声互功率谱;
步骤2.5:使用噪声互功率谱对语音信号进行降噪,获得降噪后的语音信号;
所述步骤三,具体为:结合单通道的晚期混响功率谱指数衰减模型和双麦克风的频域信号,将该模型扩张到双通道,计算晚期混响功率谱ρr(k,l),表达式如下:
ρr(k,l)=e-2αTρd(k,l-T′);
其中β是衰减系数,α表示衰减指数系数,T是混响时间,ρr(k,l)是计算出的晚期混响功率谱;
通过晚期混响功率谱ρr(k,l)进一步计算混响抑制增益G(k,l),表达式如下:
其中表示基于晚期混响的后验信噪比;
通过混响抑制增益G(k,l)对降噪后的语音信号做抑制混响处理,获得去混响后的幅度谱:对做最小下限保护:
2.如权利要求1所述的一种双麦克风语音增强方法,其特征在于,所述步骤2.1,具体为:对两个通道进行延迟对齐操作后,利用当前帧的双麦克风频域信号和前一帧的自功率谱计算当前帧的自功率谱,以及利用当前帧的双麦克风频域信号和前一帧的互功率谱计算当前帧的互功率谱,并施加平滑,表达式如下:
其中,两个通道的自功率谱为:
两个通道的互功率谱为:
其中0<λ<1。
3.如权利要求2所述的一种双麦克风语音增强方法,其特征在于,所述步骤2.2,具体为:利用步骤2.1计算出的自功率谱和互功率谱计算互相关函数,互相关函数表达式如下:
利用互相关函数和预先选取的频率范围进一步计算互相关函数均值,互相关函数均值的表达式如下:
其中表示向下取整,Fs表示采样率。
4.如权利要求3所述的一种双麦克风语音增强方法,其特征在于,所述步骤2.3,具体为:设定阈值,判断互相关函数均值Γmean(k,l)是否大于所述阈值,如果大于阈值,则判断语音活跃即有语音段,进入步骤2.5;反之则判断无语音段,进入步骤2.4。
5.如权利要求4所述的一种双麦克风语音增强方法,其特征在于,所述步骤2.4,具体为:使用前一帧的噪声互功率谱和当前帧的双麦克风的频域信号计算当前帧的噪声互功率谱,噪声互功率谱的表达式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310123145.X/1.html,转载请声明来源钻瓜专利网。