[发明专利]基于干扰噪声空间谱矩阵的语音信号波束成形方法有效
申请号: | 202211565066.6 | 申请日: | 2022-12-07 |
公开(公告)号: | CN116312602B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 肖永雄;宛敏红;宋伟;朱世强;顾建军 | 申请(专利权)人: | 之江实验室 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 311121 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 干扰 噪声 空间 矩阵 语音 信号 波束 成形 方法 | ||
1.一种基于干扰噪声空间谱矩阵的语音信号波束成形方法,其特征在于,所述方法包括:
基于麦克风阵列流形矢量计算球面扩散噪声的空间谱矩阵;
在麦克风没有检测到语音信号时,计算背景噪声的空间谱矩阵;
在麦克风检测到语音信号后,计算信号空间谱矩阵;
基于麦克风阵列流形矢量和信号空间谱矩阵对Capon空间谱进行积分,计算干扰语音信号的空间谱矩阵;
球面扩散噪声的空间谱矩阵、背景噪声的空间谱矩阵、干扰语音信号的空间谱矩阵叠加得到干扰噪声空间谱矩阵;
对干扰噪声空间谱矩阵进行特征值分解,获取特征向量和噪声功率估计值,并以此更新干扰噪声空间谱矩阵;
利用更新的干扰噪声空间谱矩阵通过线性约束最小方差波束形成方法计算波束成形的滤波系数矩阵;基于麦克风阵列接收到的声信号向量与滤波系数矩阵得到波束增强的语音信号。
2.根据权利要求1所述的基于干扰噪声空间谱矩阵的语音信号波束成形方法,其特征在于,基于麦克风阵列流形矢量计算球面扩散噪声的空间谱矩阵的计算公式如下:
其中,f为频率;d(Θ,f)为麦克风阵列流形矢量,假设在单次语音交互过程不随时间帧变化;为方向矢量,θ和φ分别为三维坐标系的俯仰角和方位角;[·]H为矩阵的共轭转置。
3.根据权利要求1所述的基于干扰噪声空间谱矩阵的语音信号波束成形方法,其特征在于,在麦克风没有检测到语音信号时,计算背景噪声的空间谱矩阵的过程包括:
采用语音活性检测算法识别语音信号,当在麦克风接收信号中没有检测到语音信号时,M个麦克风阵元接收到的信号的短时傅里叶变换向量为v(n,f),n为短时傅里叶变换时间帧的索引;
采用重叠帧移和前向平均的方法,对每一个频率分量,计算背景噪声的空间谱矩阵Φv(f):
其中,Vi(n,f),i=1,2,...M,为第i个麦克风接收到的声信号,v(n,f)为M个麦克风声信号堆成的列向量,[·]T为常规矩阵转置,E[·]为数学期望,[·]H为矩阵的共轭转置,为无语音信号时段重叠帧移产生的总帧数,表示向下取整,Nv=TvFs为无语音信号时段总的采样点数,Tv为无语音信号时麦克风阵列采集到的信号的总时长,Fs为采样频率,L为每帧信号的点数,Ls为帧移时重叠的点数。
4.根据权利要求1所述的基于干扰噪声空间谱矩阵的语音信号波束成形方法,其特征在于,在麦克风检测到语音信号后,计算信号空间谱矩阵的过程包括:
采用语音活性检测算法识别语音信号,在麦克风检测到语音信号后,M个麦克风阵元接收到的信号的短时傅里叶变换向量为y(n,f);
采用重叠帧移和前向平均值的方法,对每一个频率分量,计算信号空间谱矩阵Φy(f):
其中为有语音信号时段重叠帧移产生总的帧数,其中Nx为有语音信号时段总的采样点数。
5.根据权利要求1所述的基于干扰噪声空间谱矩阵的语音信号波束成形方法,其特征在于,对球面扩散噪声的空间谱矩阵、背景噪声的空间谱矩阵、干扰语音信号的空间谱矩阵叠加得到干扰噪声空间谱矩阵,计算公式如下:
其中干扰语音信号的空间谱矩阵由对Capon空间谱在信号方位角所在区域进行积分得到,计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211565066.6/1.html,转载请声明来源钻瓜专利网。