[发明专利]用于波束形成以获得语音和噪声信号的装置和方法有效
申请号: | 201480019733.8 | 申请日: | 2014-02-03 |
公开(公告)号: | CN105532017B | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 凯文·J·巴什迪尔;贾尔斯·T·戴维斯;普拉门·A·伊万诺夫;里瓦纳尔多·S·奥利韦拉;坦卡西·V·拉玛巴德兰;斯内海特哈·辛加拉朱 | 申请(专利权)人: | 谷歌技术控股有限责任公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00;G10L21/0208;G10L15/01;G10L25/78;G10L21/0216 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李佳;穆德骏 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 波束 形成 获得 语音 噪声 信号 装置 方法 | ||
1.一种用于波束形成的方法,包括:
将多个麦克风输出进行波束形成,以获得多个虚拟麦克风音频通道,每个虚拟麦克风音频通道对应于一个波束形成,包括至少一个语音通道和至少一个噪声通道;
对所述至少一个语音通道执行语音活动检测;
调整对应的语音波束形成,直到语音活动检测指示在所述至少一个语音通道上存在语音,以及
调整至少第二波束形成,直到在所述至少一个噪声通道中辨识了干扰机语音或背景噪声。
2.如权利要求1所述的方法,还包括:
对所述至少一个噪声通道执行语音活动检测;以及
调整对应的噪声波束形成,直到语音活动检测指示在所述至少一个噪声通道上不存在语音。
3.如权利要求2所述的方法,还包括:
对所述至少一个噪声通道执行能量估计;以及
调整对应的噪声波束形成,直到能量估计指示所述至少一个噪声通道正在从主导音频能量源接收音频。
4.如权利要求1所述的方法,还包括:
对所述至少一个语音通道执行语音识别;以及
调整对应的语音波束形成,以提高所述语音识别的语音识别置信度量。
5.如权利要求1所述的方法,还包括:
对所述至少一个噪声通道执行语音识别;以及
调整对应的噪声波束形成,以降低所述语音识别的语音识别置信度量。
6.如权利要求5所述的方法,其中,对所述至少一个噪声通道执行语音识别,包括:
使用被训练成辨识特定说话者的经训练的语音识别,对所述至少一个噪声通道执行语音识别。
7.如权利要求1所述的方法,还包括:
初始时基于对应麦克风组的检测方位,来配置所述多个麦克风输出。
8.一种用于波束形成的方法,包括:
将多个麦克风输出进行波束形成,以获得多个虚拟麦克风音频通道,其中,每个虚拟麦克风音频通道对应于一个波束形成,包括至少一个语音通道和至少一个噪声通道;
对所述至少一个语音通道执行语音识别;
调整对应的语音波束形成,以提高所述语音识别的语音识别置信度量,以及
调整对应的噪声波束形成,直到在所述至少一个噪声通道中辨识到干扰机语音或背景噪声。
9.如权利要求8所述的方法,其中,对所述至少一个语音通道执行语音识别,包括:
使用被训练成辨识特定说话者的经训练的语音识别,对所述至少一个语音通道执行语音识别。
10.如权利要求8所述的方法,还包括:
对所述至少一个噪声通道执行语音活动检测;以及
调整对应的噪声波束形成,直到语音活动检测指示在所述至少一个噪声通道上不存在语音。
11.如权利要求10所述的方法,还包括:
对所述至少一个噪声通道执行能量估计;以及
调整对应的噪声波束形成,直到能量估计指示所述至少一个噪声通道正在从主导音频能量源接收音频。
12.如权利要求8所述的方法,还包括:
对所述至少一个噪声通道执行语音活动检测;以及
调整对应的噪声波束形成,直到语音活动检测指示在所述至少一个噪声通道上存在语音。
13.如权利要求8所述的方法,还包括:
对所述至少一个噪声通道执行语音识别;以及
调整对应的噪声波束形成,以降低所述语音识别的语音识别置信度量。
14.如权利要求12所述的方法,还包括:
响应于语音活动检测指示所述至少一个噪声通道上存在语音,对所述至少一个噪声通道执行语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌技术控股有限责任公司,未经谷歌技术控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480019733.8/1.html,转载请声明来源钻瓜专利网。