[发明专利]一种基于二阶微分麦克风阵列的语音增强算法在审
申请号: | 201910275383.6 | 申请日: | 2019-04-08 |
公开(公告)号: | CN110310650A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 李冬梅;辜君龙;刘润生 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 廖元秋 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于二阶微分麦克风阵列的语音增强算法,属于语音信号处理领域。该方法首先搭建麦克风阵列并采集说话人语音的3路语音信号,使用二阶微分算法提取目标语音波束形成信号和噪声波束形成信号并分帧分频带,任意选取一路语音信号分帧分频带,计算每个时频单元的掩蔽值并进行平滑处理,得到每个时频单元增强后的语音的时频单元值;最后通过逆傅里叶变换,加窗并重叠相加得到说话人语音对应的增强信号。该方法结合波束形成算法与计算听觉场景分析算法,将波束形成结果仅作为目标语音和噪声能量的估计,并对计算听觉场景分析中掩蔽值产生过程进行了优化,使得掩蔽值更加平滑适宜于实际应用场景,使得最终语音合成后增强效果明显。 | ||
搜索关键词: | 掩蔽 麦克风阵列 时频单元 二阶 语音增强算法 目标语音 听觉场景 语音信号 语音 分帧 波束形成算法 波束形成信号 逆傅里叶变换 语音信号处理 波束形成 分析算法 平滑处理 微分算法 应用场景 语音合成 噪声波束 噪声能量 增强信号 平滑 加窗 相加 采集 优化 分析 | ||
【主权项】:
1.一种基于二阶微分麦克风阵列的语音增强算法,其特征在于,包括以下步骤:1)构建由3个或4个麦克风组成的麦克风阵列;若麦克风为3个,则3个麦克风排成一列,且第1个麦克风到第2个麦克风的距离与第2个麦克风到第3个麦克风的距离相等;若麦克风为4个,则4个麦克风排成一列,且第1个麦克风到第2个麦克风的距离与第2个麦克风到第3个麦克风的距离相同,第1个麦克风到第3个麦克风的距离与第3个麦克风到第4个麦克风的距离相等;2)利用步骤1)构建的麦克风阵列,选取3个麦克风分别实时采集说话人语音得到3路语音信号;采集信号时,将麦克风排列的直线对准说话人,将沿着麦克风排列的直线方向分别设为0°角和180°角方向,其中说话人发出的声音的方向为0°方向记为增强方向,与说话人发出声音相反的方向为180°方向记为主抑制方向;其中,若麦克风阵列为4个麦克风时,选用第1、2、3个麦克风采集语音信号,或选用第1、3、4个麦克风采集语音信号;3)利用步骤2)得到的3路语音信号,使用二阶微分算法分别提取目标语音的波束形成信号和噪声波束形成信号;其中,将波束方向指向0°方向得到目标语音波束形成信号,将波束方向指向180°方向得到噪声波束形成信号;将目标语音波束形成信号作为目标语音能量估计,将噪声波束形成信号作为噪声能量估计;4)掩蔽值的计算与平滑;具体步骤如下:4.1)对步骤3)得到的目标语音波束形成信号进行分帧分频带得到S(λ,μ),对步骤3)得到的噪声语音波束形成信号进行分帧分频带得到N(λ,μ),从步骤2)得到的3路语音信号中任选一路语音信号进行分帧分频带得到Y(λ,μ),其中S(λ,μ)表示目标语音波束形成信号第λ帧第μ个频带上的语音能量,N(λ,μ)表示噪声波束形成信号第λ帧第μ个频带上的噪声能量,Y(λ,μ)表示所选语音信号第λ帧第μ个频带上的能量;所述分帧分频带方法如下:对每个信号,令0.02秒为1帧,帧移为0.01秒,然后对每一帧进行快速傅里叶变换,将每一帧分为M个频带,从而将每个信号分成帧数乘以频带数个时频单元;4.2)计算掩蔽值;掩蔽函数表达式如下:
其中,G(λ,μ)表示第λ帧第μ个频带上的掩蔽值;4.3)掩蔽值的平滑;首先对每一帧信号计算信号增强比δ(λ),表达式如下:
其中,M为总频带数;计算平滑滤波器,表达式如下:![]()
其中,round为四舍五入的函数,N(λ)为中间变量;掩蔽值的平滑方法如式(5)所示:GPF(λ,μ)=|G(λ,μ)|*H(μ) (5)其中,GPF(λ,μ)表示第λ帧第μ个频带上平滑后的掩蔽值,*表示卷积操作;5)语音合成;5.1)将步骤4.1)所选语音信号每个时频单元值Y(λ,μ)与该单元对应的平滑后的掩蔽值GPF(λ,μ)相乘,得到该单元增强后的语音的时频单元值;5.2)语音合成:将每个增强后的语音的时频单元进行逆傅里叶变换,然后加窗并重叠相加得到步骤2)采集的说话人语音对应的增强信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910275383.6/,转载请声明来源钻瓜专利网。