[发明专利]一种用于噪声环境下声源分离和定位方法有效
申请号: | 201410249428.X | 申请日: | 2014-06-06 |
公开(公告)号: | CN104053107B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 柴毅;屈剑锋;王坤朋;杨志敏;董勇 | 申请(专利权)人: | 重庆大学 |
主分类号: | H04R25/00 | 分类号: | H04R25/00;H04R27/02;G10L21/0272 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400044 重庆市沙坪*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声源 麦克风阵列 交谈对象 噪声环境 麦克风信号 定位模块 声源位置 助听装置 显示器 模拟信号放大器 采集 信号采集器 语音信号源 定位功能 键盘选择 空间搜索 盲源分离 说话声音 语音信号 准确方位 自动分离 互相关 源选择 和声 键盘 | ||
1.一种用于噪声环境下声源分离和定位方法,其特征在于:包括如下步骤:
a.采用助听装置对交谈过程中的语音信号进行采集;
所述助听装置包括麦克风阵列(1006)、声源位置显示器(1001)、声源分离与定位模块(1002)、信号采集器(1003)、模拟信号放大器(1004)和声源选择键盘(1005);
所述麦克风阵列(1006)、模拟信号放大器(1004)、信号采集器(1003)、声源分离与定位模块(1002)和声源位置显示器(1001)依次连接;
所述声源选择键盘(1005)与声源分离与定位模块(1002)连接;
所述声源分离与定位模块(1002)采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位;采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象(1009)和其他人(1010)说话声音的声源,用户通过声源选择键盘(1005)选择出属于交谈对象(1009)的声源,根据选择的声源计算出交谈对象(1009)相对于麦克风阵列(1006)的准确方位,并在声源位置显示器(1001)中显示该声源的方位;
所述麦克风阵列(1006)由微型麦克风(1007)构成:
所述麦克风阵列(1006)由8个独立的微型麦克风(1007)均匀排列在正方形边上,正方形边长为10厘米,任意两个微型麦克风(1007)中心点之间的距离(1008)为5厘米;
所述微型麦克风(1007)的指向性为全向型,无指向,直径小于1厘米;
a1.所述助听装置采用模拟信号放大器(1004)对麦克风阵列(1006)中8个微型麦克风(1007)的语音信号进行放大,放大后的信号传输至信号采集器(1003);
a2.所述信号采集器(1003)对模拟信号放大器(1004)放大后的信号进行滤波、模/数转换和采集,采样频率为16KHz,采样精度为16位,并对采集的信号进行储存;
b.所述声源分离与定位模块(1002)采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,具体步骤如下:
b1.信号采集器得到8路观测信号x(t)=[x1(t),x2(t),…,xs(t)]T,t为采样时刻;
b2.观测信号x(t)被建模为8个声源s(t)=[s1(t),s2(t),…,ss(t)]T的线性混合:
式(1)中v为空气中声音传播的速度,约为340米/秒;amn,m,n=1,2,…,8为第n个声源到达第m个微型麦克风的距离,声源信号的幅值衰减与距离amn成反比关系,声源sn,n=1,2,…,8到达各微型麦克风的时间延迟与距离amn成正比关系:η(t)=(η1(t),η2(t),…,η8(t))T为微型麦克风的噪声;公式(1)简写为
x(t)=As(t)+η(t)(2)式(2)中A为8×8声源混合矩阵;
b3.采用互相关法对采集的麦克风信号进行处理,计算得到声源相对于麦克风阵列的初始方位,具体如下:
b301:为了降低声源定位和分离算法的复杂度,构建一个栅格化的正方体,并存储每个栅格顶点至微型麦克风(2003)的距离;将麦克风阵列正前方的正方体区域进行栅格化处理,正方体的边长为10厘米,栅格的边长为1厘米,最小栅格的边长为1厘米,记栅格顶点(2001)为gijk,i,j,k=1,2,…,10;
b302:栅格顶点gijk距离第m个微型麦克风(2003)的距离(2002)为dm,将gijk至8个微型麦克风(2003)的距离写作列向量形式为d,将所有栅格顶点至微型麦克风的距离写作矩阵形式为D,矩阵的第l列表示第(k-1)×100+(j-1)×10+i个栅格点;
b303:由公式(1)知,任意两路观测信号xm(t)与xm'(t),m,m'∈{1,2,…,8}进行延迟相关运算Cτ=xm(t)·xm'(t-τ),τ∈[-0.414/v,0.414/v],τ为延迟时间,必然存在8个极大值n=1,2,…,8;由于τ非采样时间间隔的整倍数,在计算时需要首先对观测信号x(t)进行自然三次样条插值,对于采样时刻t0,t1,…,tp,对应的采样点xm=[y0,y1,…,yP]T,P为采样点数目,插值计算后得到的观测信号为插值函数为:
hp=tp+1-t,0≤p≤P
系数b0,b1,…,bP通过求解式(4)得到;
b304:分别计算微型麦克风(3001)与(3002)、(3003)、(3004)采集到观测信号之间的延迟相关系数Cτ的极大值,并利用极大值处对应的延迟时间和计算出声源相对于微型麦克风的方位;
b305:利用延迟时间τ与声速v相乘分别计算8个声源与4个微型麦克风(3001)、(3002)、(3003)、(3004)的距离d1,d3,d6,d8,并通过计算求取与声源距离最近的栅格点gijk,进而得到8个声源距离8个微型麦克风的距离,即声源混合矩阵A;
b4.采用空间搜索的方法以最小化声源之间互信息I为目标函数,同时分离出混合在观测信号x(t)中的所有声源n=1,2,…,8,由于语音信号为短时平稳信号,通常认为在20毫秒的采样时长内等效为平稳信号,因此,以下过程需要在有限时间T内完成,T≤20ms,具体如下:
b401:初始化空间搜索次数r←0,声源混合矩阵A(0)←A,互信息最小值I*←+∞,时间tc←0;
b402:对声源混合矩阵A(r)进行求逆运算得到矩阵W(r),利用计算得到真实声源信号的估计信号并对其进行标准化处理,使得各声源估计信号均值为0方差为1;
b403:采用互信息度量声源信号之间的相互独立性,声源之间的互信息是一个非负指标,当且仅当各信号之间相互独立时互信息为零;分别记xm=(xm(1),…,xm(P))为第m个观测信号,为真实声源信号的估计,P是采样点数目;由此,估计声源信号之间的互信息写为:
式中,为估计声源信号的边缘熵,为:
若I(r)<I*,则置I*←I(r),否则,进入下一步;
b404:随机搜索8个声源附近的栅格点,得到一组新的栅格点及其对应的到达微型麦克风的距离,通过查询距离矩阵D,得到新的声源混合矩阵A;
b405:若计算时间tc<T,置迭代次数r←r+1,置下一次迭代的混合矩阵为A(r)←A,返回b402进行迭代计算,否则,结束迭代过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410249428.X/1.html,转载请声明来源钻瓜专利网。