[发明专利]一种基于深度神经网络的声源定位方法及系统有效

专利信息
申请号: 202010050760.9 申请日: 2020-01-17
公开(公告)号: CN111239687B 公开(公告)日: 2021-12-14
发明(设计)人: 张巧灵;唐柔冰;马晗 申请(专利权)人: 浙江理工大学
主分类号: G01S5/22 分类号: G01S5/22
代理公司: 浙江千克知识产权代理有限公司 33246 代理人: 周希良
地址: 310018 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 神经网络 声源 定位 方法 系统
【说明书】:

发明公开了定位方法,包括:S1.获取麦克风接收的语音信号,并生成语音数据集;S2.对语音数据集内的语音信号进行预处理;S3.计算语音信号对应的声源信号的相位加权广义互相关函数;S4.获取相位加权广义互相关函数波峰对应的时延信息,将时延信息作为声源信号到达麦克风的TDOA观测值;获取时延信息对应的幅值;S5.将TDOA观测值与幅值结合作为输入向量,将声源信号对应的三维空间位置坐标作为输出向量,结合输入向量和输出向量生成特征向量;S6.对特征向量进行预处理;S7.设置深度神经网络相关的参数,并用训练集的特征向量训练深度神经网络,得到训练好的深度神经网络;S8.将测试集的输入向量传入训练好的深度神经网络进行预测,得到声源信号的三维空间坐标。

技术领域

本发明涉及室内声源定位技术领域,尤其涉及一种基于深度神经网络的声源定位方法及系统。

背景技术

近年来,智能服务型产品(如智能音箱,智能家居等)在现实生活中得到广泛应用,为了获得良好的用户体验,产品的人机交互能力得到越来越多人的关注。在人机交互中,语音沟通是不可或缺的一部分,人们可以直接下达语音口令命令机器提供相应的服务,机器对语音口令进行识别并提供相应的服务,勿需手动操作。目前,在近场语音识别应用场景下(如手机端),麦克风接收的语音信号质量很高,语音识别率已满足实际要求。然而,在智能家居等远场语音识别应用场景下,麦克风捕捉到的语音信号质量较差,语音识别率低,无法满足实际要求。因此,解决远场语音识别应用落地日益成为近年来国内外机构的研究热点。目前,在语音识别前端利用声源定位算法估计声源位置,增强该位置方向的声源信号,同时削弱其他方向的干扰信号的方法能提高语音信号质量,提高语音识别率,该方法能有效解决远场语音识别应用落地。其中,在语音识别之前进行有效的声源定位,在实际中具有重要意义。

经典的定位算法主要是二维空间的声源定位算法,这类算法主要分为三大类:一是基于时延估计(Time Difference of Arrival,TDOA)的算法。时延估计算法,又称到达时间差算法,根据两个不同位置麦克风接收同一声源信号的时间差确定声源的位置。它将两个麦克风接收声音信号的广义互相关函数(Generalized Cross Correlation,GCC)的最大波峰对应的时延作为时间延迟估计,进而利用麦克风阵列的几何约束得到声源位置估计。这类方法容易受环境噪声以及室内混响的影响,当噪声较大或者混响严重时,GCC函数出现多个伪峰(Spurious Peaks),容易估计出错误的TDOA值,进而导致错误的声源位置估计。二是基于空间谱估计的算法。基于空间谱估计的算法的基本思想是根据空间谱确定方向角以及声源的位置。由于空间信号的估计与时域信号的频率估计相似,空间谱的估计方法可由时域非线性谱推广而成,但是这类算法的前提是信号源是连续分布且空间平稳,因此此类算法的运用就大大受到限制。空间谱算法代表性算法之一是特征子空间类算法,特征子空间类算法又可分为子空间分解类算法以及子空间拟合类算法,前者的主要算法为多信号分类(Multiple Signal Classification,MUSIC)算法以及旋转不变子空间算法(EstimatingSignal Parameter via Rotational Invariance Techniques,ESPRIT),后者的算法主要为最大似然算法(Maximum Likelihood,ML)以及加权子空间拟合算法(Weighted SubspaceFitting,WSF)等。三是基于可控波束响应的算法。基于可控波束响应的算法是在麦克风阵列中全局搜索能量最大的位置,该位置即声源位置。通常,先对麦克风收集的语音信号滤波并加权求和形成波束,然后再求出波束输出功率最大的点,该点即声源位置。基于可控波束响应的算法具体又可分为延迟累加波束算法和自适应波束算法。延迟累加算法虽然信号失真小且计算量小但是抗干扰能力弱,容易受到噪声的影响。自适应算法计算量大,信号有一定的失真但是抗干扰能力强。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010050760.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top