[发明专利]一种基于麦克风阵列的声目标分类方法有效
| 申请号: | 201510151851.0 | 申请日: | 2015-04-01 |
| 公开(公告)号: | CN104766093B | 公开(公告)日: | 2018-02-16 |
| 发明(设计)人: | 郭峰;黄景昌;祖兴水;程勇博;刘华巍;李宝清;袁晓兵 | 申请(专利权)人: | 中国科学院上海微系统与信息技术研究所 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G01S3/14 |
| 代理公司: | 上海智信专利代理有限公司31002 | 代理人: | 潘振甦 |
| 地址: | 200050 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 麦克风 阵列 目标 分类 方法 | ||
1.一种基于麦克风阵列的声目标分类方法,其特征在于,包括以下步骤:
(1)麦克风阵列对声目标进行定向,通过定向算法的结果对声音信号进行常规波束形成;
(2)将常规波束形成后的信号所提取到的特征和定向角度变化量一起送入分类器进行分类;
所述的常规波束形成算法如下:
其中,c为一个调节信号幅度的常数,M为麦克风数目,wi为第i个麦克风的加权值,xi(t)为第i个麦克风所采集的信号,AH表示流型矩阵A的共轭转置,X为麦克风阵列采集信号的矩阵形式表达,ω0为进行常规波束形成所选取的参考频点,τi表示声音信号在第i个阵元处的时移;常规波束形成的方向为定向算法所得出的目标方向,j表示虚数单位;
将波束形成使用常规波束形成的方法对各个通道直接乘以一个加权值用以调整相位的方式来弥补时间差。
2.根据权利要求1所述的分类方法,其特征在于所述麦克风阵列的麦克风数量为2个或2个以上,排列方式为均匀排列或随机排列。
3.根据权利要求1所述的分类方法,其特征在于步骤(1)中所述的定向算法为现有的声阵列定向算法之一。
4.根据权利要求3所述的分类方法,其特征在于所述的定向算法包括多重信号分类算法MUSIC、旋转不变子空间法ESPRIT或最大似然算法。
5.根据权利要求1所述的分类方法,其特征在于步骤(2)中所述的定向角度变化量等于当前信号的定向角度减去其前一段信号的定向角度,提升分类算法的准确率和抗噪能力。
6.根据权利要求1所述的分类方法,其特征在于步骤(2)中所述的提取常规波束形成后信号特征的特征提取方法为现有的特征提取算法之一。
7.根据权利要求1所述的分类方法,其特征在于步骤(2)中所述的分类算法为现有的分类算法之一。
8.根据权利要求1-7任一项所述的分类方法,其特征在于直径为12cm的6阵元均匀圆阵排列的麦克风阵列采集声音信号,利用麦克风阵列采集到的声响信号进行常规波束形成,用相位差来弥补各个通道的时间差以增强信号,然后在传统特征提取算法所提取到的特征的基础上,增加了一维描述空间变化的特征即定向角度的变化量,以提高分类器性能;具体步骤是:
(1)麦克风阵列对声目标采用Music算法进行定向,t时刻定向出的角度为θt;
(2)根据定向出的角度θt对各个通道声音信号进行常规波束形成;即先按下式进行加权:
c为一个调节信号幅度的常数取1/M,M=6表示麦克风数目,wi为第i个麦克风的加权值,xi(t)为第i个麦克风所采集的信号,ω0为进行常规波束形成所选取的参考频点取340Hz,τi表示声音信号在第i个阵元处的时移,在俯仰角为0°的时候有其中r表示圆阵半径,为6cm,v表示声音在空气中的速度,常取340m/s,j表示虚数单位;
(3)将常规波束形成后的信号y(t)提取其梅尔倒谱系数MFCC,其中梅尔滤波器组包含24个滤波器,可以得到24维的梅尔倒谱系数,由于第一维表示直流分量,在取均值的条件下,第一维数值很小将其去掉,最后得到23维的梅尔倒谱系数;
(4)将步骤(3)得到的23维的梅尔倒谱系数和定向角度变化量Δθ一起构成一个24维的包含信号特征以及目标空间特征的特征向量,将最后得到的特征向量送入高斯混合模型GMM进行分类,式中Δθ=θt-θt-1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海微系统与信息技术研究所,未经中国科学院上海微系统与信息技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510151851.0/1.html,转载请声明来源钻瓜专利网。





