[发明专利]一种基于复杂环境的语音信号定位方法、装置及系统有效
申请号: | 201910190519.3 | 申请日: | 2019-03-13 |
公开(公告)号: | CN109901113B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 李勤;李楠 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G01S5/22 | 分类号: | G01S5/22 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 复杂 环境 语音 信号 定位 方法 装置 系统 | ||
本发明实施例具体公开了一种基于复杂环境的语音信号定位方法、装置及系统,包括:根据扬声器参考信号,对至少两路期望信号分别进行回声消除处理,获取至少两路第一残差信号;按照预设回声抑制传递函数,对至少两路第一残差信号中每一路第一残差信号分别进行回声抑制处理,获取至少两路第二残差信号;按照预设噪声抑制传递函数,分别对至少两路第二残差信号中的每一路第二残差信号进行噪声抑制处理,获取至少两路第三残差信号;根据至少两路第三残差信号,确定环境声音当前为语音状态时,对环境中的语音信号进行定位。通过该种方式,降低非目标语音状态信号对声源定位的干扰。实现对声源进行精准定位,提高声源定位鲁棒性。
技术领域
本发明实施例涉及信号处理技术领域,具体涉及一种基于复杂环境的语音信号定位方法、装置及系统。
背景技术
声源定位算法一般基于多个传声器组成的阵列,利用多路输入音频信号之间的相位差异估计声源方向信息。但在音频设备扬声器播放音频信号且处于较高噪声环境中时,传声器信号中存在较高能量的回声信号和噪声信号,这些信号会对声源定位算法对目标语音声源的定位造成极强的干扰,导致算法方位信息估算偏差极大,鲁棒性低。
为了解决上述问题,现有技术中存在将回声消除和静音检测等算法加入到系统中,但是这种方法在非线性回声较强和环境噪声较高的情况下,鲁棒性依然很低。
如何保证即使处于较高噪声和较强非线性回声的复杂环境中,仍然可以对声源进行精准定位,提高声源定位鲁棒性成为本申请亟待解决的技术问题。
发明内容
为此,本发明实施例提供一种基于复杂环境的语音信号定位方法、装置及系统,以解决现有技术中当处于较高噪声和较强非线性回声的复杂环境中,对声源定位不准确,鲁棒性低的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供了一种基于复杂环境的语音信号定位方法,该方法包括:
根据预获取的扬声器参考信号,对至少两路传声器采集的期望信号中每一路期望信号分别进行回声消除处理,获取至少两路第一残差信号;
按照预设回声抑制传递函数,对至少两路第一残差信号中每一路第一残差信号分别进行回声抑制处理,获取至少两路第二残差信号;
按照预设噪声抑制传递函数,分别对至少两路第二残差信号中的每一路第二残差信号进行噪声抑制处理,获取至少两路第三残差信号;根据至少两路第三残差信号,对环境声音当前所处状态进行检测;
当确定环境声音当前所处状态为语音状态时,根据至少两路第三残差信号对环境中的语音信号进行定位。
本发明实施例的特征还在于,当确定环境声音当前所处状态为静音状态时,将前一次对环境中的语音信号进行定位的定位结果作为本次定位结果。
本发明实施例的特征还在于,当确定环境声音当前所处状态为语音状态时,根据至少两路第三残差信号进行声源定位对环境中的语音信号进行定位,具体包括:
对每一路第三残差信号分别进行平滑处理,获取至少两路经过平滑处理后的信号;
根据至少两路经过平滑处理后的信号进行声源定位对环境中的语音信号进行定位。
本发明实施例的特征还在于,根据预获取的扬声器参考信号,对至少两路传声器采集的期望信号中每一路期望信号,对预获取的扬声器参考信号分别进行回声消除处理,获取至少两路第一残差信号,具体包括:
将扬声器参考信号输入至第n个自适应滤波器中,获取第n个输出信号;
将第n个期望信号与第n个输入信号输出信号进行差值运算,获取第n个第一残差信号,其中,n为大于或者等于1,且小于或者等于期望信号的路数的正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910190519.3/2.html,转载请声明来源钻瓜专利网。