[发明专利]一种基于卷积神经网络的双耳声源定位方法有效
| 申请号: | 201811045818.X | 申请日: | 2018-09-07 |
| 公开(公告)号: | CN109164415B | 公开(公告)日: | 2022-09-16 |
| 发明(设计)人: | 周琳;马康宇;陈俐源;林震宇 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G01S5/22 | 分类号: | G01S5/22;G06N3/04 |
| 代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
| 地址: | 211189 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 卷积 神经网络 声源 定位 方法 | ||
1.一种基于卷积神经网络的双耳声源定位方法,其特征在于,包括以下步骤:
(1)将训练单声道声信号与不同方位角、不同混响时间的双耳房间脉冲响应函数进行卷积,并加入不同信噪比的白噪声,得到不同声学环境下不同方位角对应的训练双耳声信号;
(2)对步骤(1)得到的训练双耳声信号进行子带滤波、分帧和加窗,得到各个子带分帧后的训练双耳声信号;
(3)对于步骤(2)得到的各个子带分帧后的训练双耳声信号,计算每一帧双耳声信号的互相关函数CCF,从而得到训练双耳声信号各个子带对应的多帧CCF;
(4)对于步骤(3)得到的各个子带对应的多帧CCF,将同一帧中不同子带的CCF函数组成一个矩阵,作为每一帧双耳声信号对应的二维特征参数;
(5)对于步骤(4)得到的每一帧二维特征参数,将其作为卷积神经网络的输入层参数,将方位角作为卷积神经网络的输出参数,基于前向传播和反向传播算法训练卷积神经网络;所述步骤(5)的训练过程具体包括以下子步骤:
(5-1)随机初始化所有卷积层和全连接层的权值;
(5-2)输入训练样本(R(τ),Y),其中R(τ)是步骤(4)获得的特征参数矩阵;Y=(y1,y2,..,yn,…,yMout),yn表示卷积神经网络的预期输出,Mout为可能的方位角个数;卷积神经网络的预期输出为:真实方位角对应的输出层神经元输出为1,输出层其余神经元输出为0,即:
式中,θtrue表示当前帧双耳声信号所对应的真实方位角,θn表示第n个输出值对应的方位角;
(5-3)根据前向传播算法,依次计算每层网络的实际输出值,直到计算出每个Softmax单元的输出y*1,y*2,..,y*n,…,y*Mout;
(5-4)计算当前训练特征参数的代价函数,定义如下:
(5-5)使用反向传播算法,计算代价函数J对网络权重的偏导,并修正权重;
(5-6)若当前迭代次数小于预设总迭代次数,则返回至(5-2),继续输入训练样本进行计算,直至得到达到预设迭代次数时迭代结束,训练卷积神经网络结束;
(6)对不同方位角、不同声学环境下的测试双耳声信号进行子带滤波、分帧和加窗,得到各个子带分帧后的测试双耳声信号;
(7)对于步骤(6)得到的各个子带分帧后的测试双耳声信号,计算每一帧双耳声信号的互相关函数CCF,从而得到测试双耳声信号各个子带对应的多帧CCF;
(8)对于步骤(7)得到的各个子带对应的多帧CCF,将同一帧中不同子带的CCF函数组成一个矩阵,作为每一帧双耳声信号对应的二维特征参数;
(9)将步骤(8)得到的每一帧二维特征参数作为步骤(5)训练后得到的卷积神经网络的输入特征,估计得到每一帧测试双耳声信号的方位角。
2.根据权利要求1所述的基于卷积神经网络的双耳声源定位方法,其特征在于,所述步骤(1)中的不同声学环境下的训练双耳声信号的计算公式为:
xL(m)=s(m)*hL(m)+vL(m)
xR(m)=s(m)*hR(m)+vR(m)
式中,xL(m)、xR(m)分别表示加入混响和噪声后的左、右耳声信号,s(m)为单声道源信号,hL(m)、hR(m)为不同混响时间对应的双耳房间冲激响应函数,vL(m)、vR(m)表示指定信噪比下的左、右耳白噪声信号,m表示样本点序号,*为卷积运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811045818.X/1.html,转载请声明来源钻瓜专利网。





