[发明专利]用于远场语音识别的预处理方法和装置有效
申请号: | 201510729573.2 | 申请日: | 2015-10-30 |
公开(公告)号: | CN105355210B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 宋辉;魏建强 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L21/0232;G10L21/034;H04M9/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 识别 预处理 方法 装置 | ||
1.一种用于远场语音识别的预处理方法,其特征在于,包括:
获取由麦克风阵列采集的多路语音信号;
根据预设的频率点阈值,将所述多路语音信号分为低频分量和中高频分量,其中,将所述多路语音信号中频率小于所述频率点阈值的部分确定为低频分量,将所述多路语音信号中频率大于所述频率点阈值的部分确定为中高频分量;
对低频分量进行延迟求和波束形成,以及,对中高频分量进行基于滤波器的波束形成;
其中,所述对中高频分量进行基于滤波器的波束形成,包括:
确定补偿滤波器;
确定加权因子;
确定相位模式分量;
根据补偿滤波器、加权因子和相位模式分量计算空间响应;
将空间响应的主波束方向调整为预设的主波束方向,根据调整后的空间响应的公式,对中高频分量进行基于滤波器的波束成形。
2.根据权利要求1所述的方法,其特征在于,还包括:
对波束形成得到的每个输出波束进行回声消除;
根据回声消除的结果选择最优波束;
对最优波束进行单通道语音增强和后处理。
3.根据权利要求1所述的方法,其特征在于,在对低频分量进行延迟求和波束形成之后,所述方法还包括:
对低频分量中的高频分量进行预加重处理。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述麦克风阵列是均匀环形麦克风阵列。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述频率点阈值是1kHz。
6.一种用于远场语音识别的预处理装置,其特征在于,包括:
获取模块,用于获取由麦克风阵列采集的多路语音信号;
划分模块,用于根据预设的频率点阈值,将所述多路语音信号分为低频分量和中高频分量,其中,将所述多路语音信号中频率小于所述频率点阈值的部分确定为低频分量,将所述多路语音信号中频率大于所述频率点阈值的部分确定为中高频分量;
波束形成模块,用于对低频分量进行延迟求和波束形成,以及,对中高频分量进行基于滤波器的波束形成;
其中,所述波束形成模块包括:中高频分量波束形成单元,所述中高频分量波束形成单元具体用于:
确定补偿滤波器;
确定加权因子;
确定相位模式分量;
根据补偿滤波器、加权因子和相位模式分量计算空间响应;
将空间响应的主波束方向调整为预设的主波束方向,根据调整后的空间响应的公式,对中高频分量进行基于滤波器的波束成形。
7.根据权利要求6所述的装置,其特征在于,还包括:
回声消除模块,用于对波束形成得到的每个输出波束进行回声消除;
选择模块,用于根据回声消除的结果选择最优波束;
后处理模块,用于对最优波束进行单通道语音增强和后处理。
8.根据权利要求6所述的装置,其特征在于,所述波束形成模块包括:
低频分量波束形成单元,用于对低频分量根据空间响应的公式,进行DS-UCA的波束成形:
预加重模块,用于对低频分量中的高频分量进行预加重处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510729573.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:牵引电机双层与单层混合风道
- 下一篇:一体式盘管电机