[发明专利]一种声音采集方法、装置及介质有效
申请号: | 201910754717.8 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110517703B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 龙韬臣;侯海宁 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 北京名华博信知识产权代理有限公司 11453 | 代理人: | 白莹 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声音 采集 方法 装置 介质 | ||
本公开是关于一种声音采集方法,将M个声音采集装置采集到的M个时域信号转换为M个原始频域信号;在N个预设网格点中的每一点处,对所述M个原始频域信号进行波束成型,以获得与所述N个预设网格点一一对应的N个波束成型频域信号;基于所述N个波束成型频域信号,确定与K个频点中的每一个相对应的N个频率分量的平均幅度,并且合成包括所述K个频点、且在每一个频点处以所述平均幅度为幅度、参考声音采集装置的原始频域信号的相位为相位的合成频域信号;将合成频域信号转换成合成时域信号。通过应用本公开实施例的声音采集方法,声音采集阵列采集的原始时域信号中的干扰方向上的噪声得到很好的抑制,由此获得增强的时域信号。
技术领域
本公开涉及声音采集领域,尤其涉及一种声音采集方法,装置及介质。
背景技术
在物联网、AI时代,智能语音作为人工智能核心技术之一,可以有效地改善人机交互的模式,大大提高智能产品使用的便捷性。相关技术中,智能产品设备拾音多采用麦克风阵列,并且应用麦克风阵列波束成型技术提高语音信号处理质量,以提高真实环境下的语音识别率。目前麦克风阵列的波束成型技术存在两个难点:1.噪声难以估计;2.强干扰下的语音方向未知。对于语音的寻向问题,目前在安静场景下寻向算法比较准确,但在强干扰场景下,寻向算法会失效,这是由寻向算法本身的约束决定的。因此,目前本领域内不能很好地解决在强干扰场景下的语音寻向问题。
发明内容
为克服相关技术中存在的问题,本公开提供一种声音采集方法、装置及介质。
根据本公开实施例的第一方面,提供一种声音采集方法,包括:
将M个声音采集装置采集到的M个时域信号转换为M个原始频域信号;
在N个预设网格点中的每一点处,对所述M个原始频域信号进行波束成型,以获得与所述N个预设网格点一一对应的N个波束成型频域信号;
基于所述N个波束成型频域信号,确定与K个频点中的每一个相对应的N个频率分量的平均幅度,并且合成包括所述K个频点、且在各个频点处以所述平均幅度为幅度的合成频域信号,所述合成频域信号在各个频点处的相位为所述M个声音采集装置中指定的参考声音采集装置的原始频域信号中的对应相位;将所述合成频域信号转换成合成时域信号,其中,M、N、K都是大于等于2的整数。
所述在N个预设网格点中的每一点处,对所述M个原始频域信号进行波束成型,以获得与所述N个预设网格点一一对应的N个波束成型频域信号包括:
在所述M个声音采集装置的期望采集范围内,选择不同方向上的N个预设网格点;
在每一个预设网格点处,基于所述M个声音采集装置与该预设网格点的位置关系,确定与各个频点相关联的导向向量;
在每一个预设网格点处,基于所述各个频点上的导向向量,对所述M个原始频域信号进行波束成型,获取与该预设网格点对应的波束成型频域信号。
所述在每一个预设网格点处,基于所述M个声音采集装置与该预设网格点的位置关系,确定与各个频点相关联的导向向量包括:
获取该预设网格点到所述M个声音采集装置的距离向量;
基于该预设网格点到所述M个声音采集装置的距离向量,以及该预设网格点到参考声音采集装置的距离,确定该预设网格点到M个声音采集装置的参考时延向量;
基于所述参考时延向量,确定该预设网格点在各个频点上的导向向量。
所述在每一个预设网格点处,基于所述各个频点上的导向向量,对所述M个原始频域信号进行波束成型,获取与该预设网格点对应的波束成型频域信号包括:
基于所述各个频点的导向向量以及各个频点的噪声协方差矩阵,确定与各个频点对应的波束成型权系数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910754717.8/2.html,转载请声明来源钻瓜专利网。