[发明专利]语音处理方法及装置在审
申请号: | 202111003630.0 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113744752A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 聂玮奇;刘煜;刘博洋;季经伟 | 申请(专利权)人: | 西安声必捷信息科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 彭豆 |
地址: | 710075 陕西省西安市*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 装置 | ||
本公开提供一种语音处理方法及装置,涉及语音技术领域,所述方法包括获取至少两个待处理音频信号;所述至少两个待处理音频信号中包括麦克风阵列获取的音频信号;对所述麦克风阵列中任意两个麦克风进行波达方向估计;根据所述波达方向估计和波束形成算法对所述待处理音频信号进行波束形成处理;对波束形成处理后的待处理音频信号进行噪声抑制,得到目标音频信号;输出所述目标音频信号。本公开实现了音频拾取和增强功能,提高了音频识别的准确性。
技术领域
本公开涉及语音技术领域,尤其涉及语音处理方法及装置。
背景技术
随着人工智能技术的不断发展,各领域中的传统设备都将逐渐被相应的智能终端所代替。智能终端是具有监控、感知、通信以及智能交互多种功能的全开放式平台,搭载了操作系统,可自行安装和卸载各类应用软件,持续对功能进行扩充和升级的新型终端产品。在智能交互方面,很多复杂的项目并不是仅凭目标常用的遥控以及触摸屏就能实现的,其中最好的办法就是采用声音遥控,而声音遥控的关键是语音信号的获取与识别。
相关技术中,在获取到语音信号时,通常是直接对语音信号进行滤波后输出。
但在上述技术中,若获取到的语音信号中包含多个方向的语音时,仅滤波会导致最终得到的语音信号中的噪音较多,从而降低了语音识别的准确性。
发明内容
本公开实施例提供一种语音处理方法及装置,能够解决现有技术中降低了语音识别的准确性的问题。所述技术方案如下:
根据本公开实施例的第一方面,提供一种语音处理方法,所述方法包括:
获取至少两个待处理音频信号;所述至少两个待处理音频信号中包括麦克风阵列获取的音频信号;
对所述麦克风阵列中任意两个麦克风进行波达方向估计;
根据所述波达方向估计和波束形成算法对所述待处理音频信号进行波束形成处理;
对波束形成处理后的待处理音频信号进行噪声抑制,得到目标音频信号;
输出所述目标音频信号。
本公开实施例提供一种语音处理方法,在获取到多个待处理音频信号时,对麦克风阵列中任意两个麦克风进行波达方向估计,并根据波达方向估计和波束形成算法对待处理音频信号进行波束形成处理,并对波束形成处理后的待处理音频信号进行噪声抑制,最终将降噪抑制后得到的目标音频信号进行输出。可知,本公开对每两个待处理音频信号均进行了波达方向估计,并对波束形成处理后的待处理音频信号进行了噪声抑制处理,从而实现了音频拾取和增强功能,提高了音频识别的准确性。
在一个实施例中,在所述对所述麦克风阵列中任意两个麦克风进行波达方向估计之前,还包括:
对每个所述待处理音频信号进行语音活动检测和噪声估计,并根据所述语音活动检测和噪声估计的结果确定音频信号存在概率;
所述对所述麦克风阵列中任意两个麦克风进行波达方向估计包括:
根据所述音频信号存在概率对所述麦克风阵列中任意两个麦克风进行波达方向估计。
在一个实施例中,所述根据所述音频信号存在概率对所述麦克风阵列中任意两个麦克风进行波达方向估计包括:
根据所述音频信号的存在概率计算所述麦克风阵列中任意两个麦克风的时延估计,根据所述时延估计的结果计算目标声源与麦克风阵列的相对角度。
在一个实施例中,所述对每个所述待处理音频信号进行语音活动检测和噪声估计包括:
确定是否有同步输入信号;
在确定有所述同步输入信号时,对每个所述待处理音频信号进行回声消除处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安声必捷信息科技有限公司,未经西安声必捷信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111003630.0/2.html,转载请声明来源钻瓜专利网。