[发明专利]信号处理装置、信号处理方法和计算机可读介质有效
申请号: | 201980029602.0 | 申请日: | 2019-03-19 |
公开(公告)号: | CN112075088B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 立石和也 | 申请(专利权)人: | 索尼公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00;G10L15/28;G10L25/51;H04R1/40;G10L15/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 处理 装置 方法 计算机 可读 介质 | ||
本申请涉及信号处理装置、信号处理方法和计算机可读介质。本发明的目的是防止在多个麦克风的位置改变时语音提取性能的劣化。属于本发明的信号处理装置设置有语音提取单元,用于从来自多个麦克风的信号中提取语音。当多个麦克风的位置改变成其他麦克风先前所处的位置时,语音提取单元将来自多个麦克风的每个信号用作来自其他麦克风的信号。结果,可以消除每个麦克风的位置改变对语音提取的影响。
技术领域
本技术涉及一种用于执行从多个麦克风的信号中提取例如话音声音等的语音提取的信号处理装置、其方法和程序。
背景技术
近年来,随着机器人技术和人工智能(AI)的发展,越来越多的装置变得能够与人交谈或自己移动它们的身体。为了识别人类的语音,需要假设各种使用环境,并且尽可能地抑制噪声。因此,由布置有多个麦克风的麦克风阵列收集声音,并且通过使用空间信息的信号处理来抑制噪声。
例如,下面的专利文献1公开了一种技术,该技术使用通过计算由麦克风阵列收集的信号而获得的相关矩阵来估计说话人的方向,并且在所估计的方向上强调语音,以便实现准确的语音提取,从而提高语音识别的准确性。
现有技术文献
专利文献
专利文献1:日本专利申请公开号2001-337694
发明内容
本发明要解决的问题
在此处,在诸如机器人的装置当中,使一些装置在检测到语音时面向所估计的话音方向。然后,作为这样的装置,还假设了其中麦克风阵列中的每个麦克风的位置在面向话音方向时改变的装置。在这种装置中,在面对话音方向时,已经学习的噪声特性信息(具体地,空间噪声方向信息)与相应麦克风之间的位置关系崩溃,并且不能再使用已经依次学习过的噪声特性信息。
在这种情况下,可以设想在每个麦克风移位之后再次学习噪声特性信息,但是用户的下一个话音可能在装置转向至话音方向之后立即发生。在这种情况下,不能确保足够的学习时间,结果,噪声抑制性能劣化,并且存在不能执行适当的语音提取的可能性。
鉴于上面的问题而提出本技术,并且其目的是为了防止当多个麦克风的位置改变时语音提取性能的劣化。
问题的解决方案
根据本技术的信号处理装置包括语音提取单元,该语音提取单元从多个麦克风的信号中执行语音提取,其中,当多个麦克风的相应位置改变为曾经存在有其他麦克风的位置时,语音提取单元将多个麦克风的相应信号用作其他麦克风的信号。
因此,可以消除相应麦克风的位置的改变对语音提取的影响。
在根据上述本技术的信号处理装置中,期望语音提取单元通过对多个麦克风的信号进行信道移位,而将多个麦克风的相应信号用作其他麦克风的信号。
例如,信道移位可以通过简单的方法来实现,该方法诸如,向每个麦克风的信号给出标识符,该标识符指示用哪个处理信道来处理信号。
在根据上述本技术的信号处理装置中,期望语音提取单元基于布置在圆周上的多个麦克风的信号来执行语音提取。
由于基于布置在圆周上的相应麦克风的信号来执行语音提取,所以语音提取性能得到改善,因为无论声源方向是哪个方向,都可以进行语音提取。
在根据上述本技术的信号处理装置中,期望语音提取单元基于根据多个麦克风的信号而学习的噪声特性来执行语音提取。
因此,可以基于噪声分量受抑制的信号来执行语音提取。
在根据上述本技术的信号处理装置中,期望语音提取单元在多个麦克风的位置改变时,暂停噪声特性的学习。
因此,可以防止在改变麦克风位置之前已经学习的噪声特性信息由于改变位置期间的学习而改变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980029602.0/2.html,转载请声明来源钻瓜专利网。