[发明专利]一种声源定位方法、装置、介质和设备在审
| 申请号: | 201911260783.6 | 申请日: | 2019-12-10 |
| 公开(公告)号: | CN111103568A | 公开(公告)日: | 2020-05-05 |
| 发明(设计)人: | 艾文;冯大航;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G01S5/18 | 分类号: | G01S5/18;G06N3/04;G06N3/08 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 万晓君 |
| 地址: | 100080 北京市海淀区北四*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 声源 定位 方法 装置 介质 设备 | ||
1.一种声源定位方法,其特征在于,所述方法包括:
利用麦克风阵列采集设定时长的音频时域信号;
将采集到的音频时域信号转换为音频频域信号;
利用训练出的神经网络模型,确定所述音频频域信号中信噪比大于设定值的频率点;
利用所述信噪比大于设定值的频率点进行声源定位;
其中,针对训练样本集中的每个音频频域信号,对预先建立的神经网络模型执行下述操作,获得训练出的神经网络模型:
将一个音频频域信号中每个频率点的能量作为神经网络模型的输入,获得神经网络模型输出的信噪比大于设定值的频率点;
将该音频频域信号中信噪比大于设定值的频率点与神经网络模型输出的信噪比大于设定值的频率点进行比对;
根据二者之间的误差,按照减小二者之间的误差的方式,对神经网络模型进行调整。
2.如权利要求1所述的方法,其特征在于,将采集到的音频时域信号转化为音频频域信号,包括:
通过短时傅里叶变换,将采集到的音频时域信号转化为音频频域信号。
3.如权利要求1所述的方法,其特征在于,所述训练出的神经网络模型采用深度神经网络DNN模型,或者卷积神经网络CNN模型,或者长短时记忆LSTM神经网络模型。
4.如权利要求1~3任一所述的方法,其特征在于,利用所述信噪比大于设定值的频率点进行声源定位,包括:
利用所述信噪比大于设定值的频率点进行至少两次声源定位,并将获得的声源定位结果的平均值,作为声源定位结果。
5.一种声源定位装置,其特征在于,所述装置包括:
采集模块,用于利用麦克风阵列采集设定时长的音频时域信号;
转换模块,用于将采集到的音频时域信号转换为音频频域信号;
筛选模块,用于利用训练出的神经网络模型,确定所述音频频域信号中信噪比大于设定值的频率点;
定位模块,用于利用所述信噪比大于设定值的频率点进行声源定位;
其中,针对训练样本集中的每个音频频域信号,对预先建立的神经网络模型执行下述操作,获得训练出的神经网络模型:
将一个音频频域信号中每个频率点的能量作为神经网络模型的输入,获得神经网络模型输出的信噪比大于设定值的频率点;
将该音频频域信号中信噪比大于设定值的频率点与神经网络模型输出的信噪比大于设定值的频率点进行比对;
根据二者之间的误差,按照减小二者之间的误差的方式,对神经网络模型进行调整。
6.如权利要求5所述的装置,其特征在于,所述转换模块,具体用于通过短时傅里叶变换,将采集到的音频时域信号转化为音频频域信号。
7.如权利要求5所述的装置,其特征在于,所述筛选模块利用的训练出的神经网络模型采用深度神经网络DNN模型,或者卷积神经网络CNN模型,或者长短时记忆LSTM神经网络模型。
8.如权利要求5~7任一所述的装置,其特征在于,所述定位模块,具体用于利用所述信噪比大于设定值的频率点进行至少两次声源定位,并将获得的声源定位结果的平均值,作为声源定位结果。
9.一种非易失性计算机存储介质,其特征在于,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现权利要求1~4任一所述的方法。
10.一种声源定位设备,其特征在于,所述设备包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存储的程序时,实现权利要求1~4任一所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911260783.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:空调用料预测方法、系统和存储介质
- 下一篇:一种大功率COB散热封装结构





