[发明专利]一种基于卷积神经网络的双耳声源定位方法有效
| 申请号: | 201811045818.X | 申请日: | 2018-09-07 |
| 公开(公告)号: | CN109164415B | 公开(公告)日: | 2022-09-16 |
| 发明(设计)人: | 周琳;马康宇;陈俐源;林震宇 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G01S5/22 | 分类号: | G01S5/22;G06N3/04 |
| 代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
| 地址: | 211189 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 卷积 神经网络 声源 定位 方法 | ||
本发明公开了一种基于卷积神经网络的双耳声源定位方法,在子带内计算双耳声信号的互相关函数,组成二维数据作为特征参数,对卷积神经网络进行训练,得到卷积神经网络分类器;测试过程中计算测试双耳声信号的互相关函数作为二维特征参数,利用训练好的卷积神经网络分类器估计每帧双耳声信号对应的方位信息。在不同声学环境下的实验结果表明,本发明提出的基于卷积神经网络的双耳声源定位方法,具有很好的鲁棒性,尤其是在高噪声和强混响情况下显著提升了定位正确率,优于现有技术中的经典算法。
技术领域
本发明属于声源定位技术领域,涉及一种基于卷积神经网络的双耳声源定位方法。
背景技术
声源定位算法是语音信号处理的重要研究方向,也有比较广泛的应用场合。如视频会议系统中,声源定位技术可实现摄像头实时对准发言人;声源定位技术应用于语音识别的前期处理过程可以改善语音的质量,帮助提高识别的正确率;应用于助听装置时,可为听力障碍者提供声源位置信息,并提供有效语音信息。
声源定位技术所涉领域很广,包括但不限于声学、数字信号处理、信息通讯、听觉心理与生理学等。双耳声源定位利用双耳信号的差异进行分析从而估计声源方位,目前的定位算法根据其定位参数的区别可以分为两类,但均存在缺陷:
1、基于耳间差的定位
LordRayleigh于1907年在球形人头假设之上,首次提出基于耳间线索差的定位理论,即由于声源与人的双耳位置之间的位置差异,使得双耳接收到的声信号存在时间和强度差异,即耳间时间差(Inter-aural Time Difference,ITD)和耳间强度差(Inter-auralIntensity Difference,IID),这两方面因素差异是双耳声源定位的基础。与ITD、IID相关双耳声信号的互相关函数(Cross Correlation Function,CCF)也是耳间差异参数,但实际环境中由于混响和噪声的干扰,会导致定位性能的下降。
2、基于头相关传递函数的定位
ITD信息可以判断左、右方位的声源,而不能判别声音是来自前方还是后方,也不能定位仰角位置。但是基于与头相关传递函数(Head-Related Transfer Function,HRTF)的方法对声源的定位就不再局限于水平面及前向声源,可以实现对三维空间声源的定位,该方法利用HRTF数据库设计逆滤波器,通过逆滤波之后的双耳信号计算互相关值,据此来估计声源方位。此类方法解决了三维空间声源定位问题,但是计算复杂度过大,并且与头相关传递函数的个体性较强,对不同个体,或者周围环境有所差异(即存在不同噪声或混响情况下)时,可能导致实际传递函数与定位模型中使用的函数不一致,进而影响定位的准确率。
发明内容
为解决上述问题,本发明公开了一种基于卷积神经网络的双耳声源定位方法,在子带内提取出训练双耳声信号的互相关函数,组成二维特征参数作为训练样本,采用卷积神经网络对多环境下的特征参数进行训练,得到卷积神经网络分类器,测试中提取测试双耳声信号的二维特征参数,利用训练得到的卷积神经网络分类器估计每帧双耳声信号对应的方位信息。
为了达到上述目的,本发明提供如下技术方案:
一种基于卷积神经网络的双耳声源定位方法,包括以下步骤:
(1)将训练单声道声信号与不同方位角、不同混响时间的双耳房间脉冲响应函数进行卷积,并加入不同信噪比的白噪声,得到不同声学环境下不同方位角对应的训练双耳声信号;
(2)对步骤(1)得到的训练双耳声信号进行子带滤波、分帧和加窗,得到各个子带分帧后的训练双耳声信号;
(3)对于步骤(2)得到的各个子带分帧后的训练双耳声信号,计算每一帧双耳声信号的互相关函数CCF,从而得到训练双耳声信号各个子带对应的多帧CCF;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811045818.X/2.html,转载请声明来源钻瓜专利网。





