[发明专利]一种基于深度神经网络的声源定位方法及系统有效

专利信息
申请号: 202010050760.9 申请日: 2020-01-17
公开(公告)号: CN111239687B 公开(公告)日: 2021-12-14
发明(设计)人: 张巧灵;唐柔冰;马晗 申请(专利权)人: 浙江理工大学
主分类号: G01S5/22 分类号: G01S5/22
代理公司: 浙江千克知识产权代理有限公司 33246 代理人: 周希良
地址: 310018 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 神经网络 声源 定位 方法 系统
【权利要求书】:

1.一种基于深度神经网络的声源定位方法,其特征在于,包括深度神经网络的训练阶段和深度神经网络的测试阶段,包括步骤:

S1.获取麦克风接收的语音信号,并将获取到的语音信号生成语音数据集;其中,所述语音数据集包括训练数据集和测试数据集;

S2.对所述生成的语音数据集内的语音信号进行第一预处理;

S3.计算所述预处理后的语音信号所对应的声源信号的相位加权广义互相关函数;

S4.获取与所述相位加权广义互相关函数波峰相对应的时延信息,并将所述获取的时延信息作为声源信号到达麦克风的TDOA观测值;并获取所述时延信息对应的幅值;

S5.将所述TDOA观测值与幅值结合作为深度神经网络的输入向量,将声源信号对应的三维空间位置坐标作为神经网络的输出向量,将所述输入向量和输出向量结合生成特征向量;

S6.对所述生成的特征向量进行第二预处理;

S7.在深度神经网络的训练阶段,设置深度神经网络相关的参数,并用训练集的特征向量训练深度神经网络,得到训练好的深度神经网络;

S8.在深度神经网络的测试阶段,将测试集的输入向量传入训练好的深度神经网络进行预测,得到声源信号的三维空间位置坐标,并采用交叉验证评估深度神经网络模型的性能;

所述步骤S5具体为:

将时延信息及其所对应的幅值结合作为深度神经网络的输入向量I:

将声源信号S对应的三维空间位置坐标Q作为神经网络的输出向量:

将所述输入向量I和输出向量Q结合生成特征向量G:

G=(I,Q)T

2.根据权利要求1所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S1中麦克风阵列的集合为V={1,2,…,M};每个麦克风节点m包含两个麦克风,其中m∈V;M表示共有M个麦克风节点。

3.根据权利要求2所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S2具体为对麦克风节点m内的两个麦克风接收的语音信号进行第一预处理,所述第一预处理包括分帧、加窗、预加重。

4.根据权利要求2所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S3具体为计算预处理后的麦克风节点m内的两个麦克风语音信号的相位加权广义互相关函数Rm(τ),表示为:

其中,m∈V,和分别表示为在节点m处的时域麦克风信号和的所对应的频域部分;符号*表示为复共轭操作。

5.根据权利要求4所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S4获取与所述相位加权广义互相关函数Rm(τ)波峰相对应的时延信息表示为:

并获取所述时延信息对应的幅值

6.根据权利要求5所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S6中的第二预处理包括数据清洗、数据乱序、数据归一化。

7.根据权利要求6所述的一种基于深度神经网络的声源定位方法,其特征在于,所述步骤S8中采用的交叉验证包括留一验证法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010050760.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top