[发明专利]声源定位方法、装置及计算机可读存储介质有效
| 申请号: | 201910153988.8 | 申请日: | 2019-02-28 |
| 公开(公告)号: | CN110456309B | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 张洁 | 申请(专利权)人: | 深圳壹秘科技有限公司 |
| 主分类号: | G01S5/20 | 分类号: | G01S5/20 |
| 代理公司: | 深圳市恒程创新知识产权代理有限公司 44542 | 代理人: | 赵爱蓉 |
| 地址: | 518000 广东省深圳市光明新区凤凰*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声源 定位 方法 装置 计算机 可读 存储 介质 | ||
本发明公开了一种声源定位方法、装置及存储介质,方法包括:获取预设麦克风阵列中各麦克风位置和预设的多个潜在声源方位;根据各麦克风位置和各潜在声源方位,获得每个潜在声源相对各麦克风对的时延,其中麦克风对由任意两个麦克风组成;实时获取各麦克风采集的时域信号;每获取到各麦克风采集到的对应的一帧时域信号时,根据对应的一帧时域信号,获得各麦克风对在该帧的互相关函数;根据每个潜在声源相对各麦克风对的时延和各麦克风对在该帧的互相关函数,获得该帧可能声源方位;根据该帧可能声源方位、前一帧声源方位和前一帧方位协方差,获得该帧对应的声源方位。本发明解决了现有声源定位方法存在计算量大和抗干扰能力差的技术问题。
技术领域
本发明涉及声源定位领域,尤其涉及声源定位方法、装置及计算机可读存储介质。
背景技术
随着人工智能产业的飞速发展,语音交互设备越来越多的出现在人们的生活当中,例如智能音箱、智能会议机等,其中声源定位和跟踪是语音交互中的关键技术,为多麦克风降噪和音视频产品交互等方向提供技术基础。但是目前的声源定位与跟踪方法存在计算量大和抗干扰能力差的问题,从而导致现有的技术运算速度慢,不适合在性能较低的嵌入式平台运行。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种声源定位方法、装置及计算机可读存储介质,旨在解决目前的声源定位与跟踪方法存在计算量大和抗干扰能力差的技术问题。
为实现上述目的,本申请提供一种声源定位方法,包括步骤:
获取预设麦克风阵列中各麦克风位置和预设的多个潜在声源方位;
根据各麦克风位置和各潜在声源方位,获得每个潜在声源相对各麦克风对的时延,其中麦克风对由任意两个麦克风组成;
实时获取各麦克风采集的时域信号;
每获取到各麦克风采集到的对应的一帧时域信号时,根据对应的一帧时域信号,获得各麦克风对在该帧的互相关函数;
根据每个潜在声源相对各麦克风对的时延和各麦克风对在该帧的互相关函数,获得该帧可能声源方位;
获取前一帧声源方位和前一帧方位协方差,并根据该帧可能声源方位、前一帧声源方位和前一帧方位协方差,获得该帧对应的声源方位。
可选地,所述根据各麦克风位置和各潜在声源方位,获得每个潜在声源相对各麦克风对的时延,其中麦克风对由任意两个麦克风组成的步骤包括:
获取所述麦克风阵列的预设采样率;
根据各麦克风位置、各潜在声源方位、所述麦克风阵列的预设采样率和时延计算公式获得每个潜在声源相对任意两个麦克风组成的麦克风对的时延tkij;
其中tkij为第k个潜在声源相对第i个麦克风和第j个麦克风组成的麦克风对的时延,k=1,2...K,K为预设的潜在声源数量,i=1,2...M-1,j=i+1...M,M为预设麦克风阵列中麦克风数量,(xi,yi,0)为第i个麦克风位置,(xj,yj,0)为第j个麦克风位置,为第k个潜在声源方位,C0为声速,Fs为麦克风阵列的预设采样率。
可选地,所述每获取到各麦克风采集到的对应的一帧时域信号时,根据对应的一帧时域信号,获得各麦克风对在该帧的互相关函数的步骤包括:
每采集到一帧时域信号时,对各麦克风采集到的一帧时域信号进行傅里叶转换,获得各麦克风在该帧对应的频域信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹秘科技有限公司,未经深圳壹秘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910153988.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三维空间定位快速搜索方法
- 下一篇:排气系统气流啸叫声快速定位系统及方法





