[发明专利]拾音角度范围可调的双麦克风定向拾音方法和装置在审
| 申请号: | 202110939767.0 | 申请日: | 2021-08-16 |
| 公开(公告)号: | CN113660578A | 公开(公告)日: | 2021-11-16 |
| 发明(设计)人: | 孙志强;刘波 | 申请(专利权)人: | 世邦通信股份有限公司 |
| 主分类号: | H04R1/40 | 分类号: | H04R1/40;H04R1/08 |
| 代理公司: | 广州智斧知识产权代理事务所(普通合伙) 44649 | 代理人: | 孔德超 |
| 地址: | 410205 湖南省长沙*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 角度 范围 可调 麦克风 定向 方法 装置 | ||
1.一种拾音角度范围可调的双麦克风定向拾音方法,其特征在于,包括:
获取加窗后的两路麦克风各通道的单帧信号,并将所述两路麦克风单帧信号转换为频域信号;
基于所述频域信号计算语音存在的先验概率,并对所述语音先验存在概率进行平滑处理,得到平滑后的各频点语音存在的先验概率;
基于所述频域信号计算所述两路麦克风各通道的信号均值,并根据所述信号均值对应的噪声功率谱;
基于所述频域信号、噪声功率谱以及平滑后的各频点语音存在的先验概率计算语音存在的后验概率;
基于所述语音存在的后验概率计算语音的增益系数;
将所述增益系数和所述信号均值的乘积作为两路麦克风通道叠加的频域信号,并将所述叠加的频域信号进行傅里叶反变换,得到对应拾音角度范围内的时域信号。
2.根据权利要求1所述的拾音角度范围可调的双麦克风定向拾音方法,其特征在于,获取加窗后的两路麦克风各通道的单帧信号,并将所述两路麦克风单帧信号转换为频域信号,包括:
对接收的两路麦克风各通道的单帧信号进行加窗处理,得到两路麦克风各通道的单帧信号,分别为x1(n)和x2(n),其中,n为正整数,1≤n≤L,L为帧叠后的一帧语音数据的长度;
随所述两路单帧信号分别进行快速傅里叶变换,得到两路频域信号,分别为X1(k)和X2(k)其中,k为正整数,表示频点序号,1≤k≤L。
3.根据权利要求2所述的拾音角度范围可调的双麦克风定向拾音方法,其特征在于,基于所述频域信号计算语音存在的先验概率,并对所述语音先验存在概率进行平滑处理,得到平滑后的各频点语音存在的先验概率,包括:
计算语音存在的先验概率:
其中,ΔΨ(k)表示频点K所对应的相位差,即:
ΔΨ(k)=∠X1(k)-∠X2(k)
符号∠表示取相位;ζ(k)表示相位差阈值:
fs表示采样频率,d表示两个麦克风之间的直线距离,c表示空气中的声速,通常取340m/s,θ表示拾音角度;
对相邻频点的语音存在的先验概率进行平滑处理,得到平滑后的各频点语音存在的先验概率
其中,w(i)表示Gammatone滤波器系数,0≤i≤I-1,I为Gammatone通道的数量;w(i)按照下式进行计算:
其中,表示两路麦克风信号的信号均值:
Hi(k)表示Gammatone滤波器曲线的采样值。
4.根据权利要求3所述的拾音角度范围可调的双麦克风定向拾音方法,其特征在于,基于所述频域信号计算所述两路麦克风各通道的信号均值,并根据所述信号均值对应的噪声功率谱,包括:
以作为单通道语音信号,按照噪声谱估计方法计算对应的噪声功率谱λ(k)。
5.根据权利要求4所述的拾音角度范围可调的双麦克风定向拾音方法,其特征在于,基于所述频域信号、噪声功率谱以及平滑后的各频点语音存在的先验概率计算语音存在的后验概率,包括:
计算后验信噪比γs(k):
计算语音存在的先验概率的均值以先验概率的均值作为判断单帧信号是否存在语音的标识:
其中,kmax和kmin分别表示最大频点和最小频点对应的序号;
计算语音不存在的后验概率q(k):
其中,表示先验概率均值的阈值,与拾音范围角度的大小有关系;γmax表示后验信噪比的最大值;
计算先验信噪比ξ(k):
ξ(k)=max(γs(k)-1,0)
计算语音存在的后验概率Ppos(k):
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世邦通信股份有限公司,未经世邦通信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110939767.0/1.html,转载请声明来源钻瓜专利网。





