[发明专利]基于分布矩阵决策的声音定位方法有效
申请号: | 201610893331.1 | 申请日: | 2016-10-13 |
公开(公告)号: | CN106526541B | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 王建中;叶凯;曹九稳;薛安克;王天磊 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G01S5/18 | 分类号: | G01S5/18 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杜军 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布矩阵 声音定位 预处理 矩阵 声音识别结果 多通道数据 定位结果 定位算法 环境背景 角度区间 宽带声音 目标声源 声音识别 算法结果 单通道 多通道 声阵列 准确率 分帧 构建 算法 决策 集合 采集 统计 | ||
1.基于分布矩阵决策的声音定位方法,其特征在于包括如下步骤:
步骤1、对声阵列采集到的四通道声音信号进行预处理;
所述预处理为对四通道声音信号进行分帧处理;
步骤2、对每一帧单通道信号进行声音识别;
步骤3、对每一帧四通道信号进行宽带声音定位;
步骤4、根据步骤2、3得到的识别和定位结果集合,构建分布矩阵M,其中M(Ci,Aj)表示的是所有帧中识别结果为Ci定位结果为Aj的帧的个数;
步骤5、得到分布矩阵后,找到目标声源的定位分布峰值;
步骤6、选择峰值及其相邻两个角度区间,计算这三个区间的统计均值,即为最后的定位结果。
2.根据权利要求1所述的基于分布矩阵决策的声音定位方法,其特征在于所述的步骤1:采用十字形声阵列获取现场声音信号,记采样频率为fs;对四通道声音信号进行分帧处理,假设分帧后的帧数是m;接下来对分帧后的每一帧信号进行处理。
3.根据权利要求2所述的基于分布矩阵决策的声音定位方法,其特征在于,所述的步骤2对每一帧单通道信号进行声音识别的算法为LPCC+SVM算法;
每一帧得到一个识别结果,从而构成长度为m的识别结果数组C;
C=[c(1) c(2) … c(m)]。
4.根据权利要求3所述的基于分布矩阵决策的声音定位方法,其特征在于,所述的步骤3对每一帧四通道信号进行宽带声音定位的算法为宽带MUSIC算法,具体如下:
3-1、根据需要选取频带和中心频率f0,所述的频带和中心频率f0需要根据实际目标信号的频率特征来进行选择;
3-2、对每一帧四通道信号做FFT傅里叶变换,变换后每一帧四通道信号的模型X(fj)表示为:
X(fj)=Aθ(fj)S(fj)+N(fj),j=1,2,3...J 公式1
Aθ(fj)是导向向量,S(fj)和N(fj)分别是FFT傅里叶变换后的声源信号和噪声;
变换后将所选频带划分成多个频率为fj的窄带信号的组合;
3-3、利用聚焦矩阵T,将每个窄带所在频率fj通过聚焦变化至中心频率f0所在窄带,变化过程如下:
T(fj)A(fj)S(fj)=A(f0)S(f0) 公式2
其中,A(f)是导向向量;并且通过公式3求得中心频率f0处的自相关矩阵,用于定位:
3-4、对中心频率f0所在窄带进行定位,得到此帧数据的定位结果;每一帧对应一个定位结果,从而构成长度为m的定位结果数组A;
A=[a(1) a(2) … a(m)]。
5.根据权利要求4所述的基于分布矩阵决策的声音定位方法,其特征在于所述的步骤4:根据步骤2和步骤3得到的识别结果数组C和定位结果数组A,构造分布矩阵M;
以识别结果数组C的取值为横坐标,以定位结果数组A的角度取值范围为纵坐标,遍历每一帧的结果,构建分布矩阵M,其中M(Ci,Aj)表示的是所有帧中识别结果为Ci定位结果为Aj的帧的个数。
6.根据权利要求5所述的基于分布矩阵决策的声音定位方法,其特征在于所述的步骤5:得到分布矩阵后,通过识别结果Ci找到目标声源的定位分布峰值Atop。
7.根据权利要求6所述的基于分布矩阵决策的声音定位方法,其特征在于所述的步骤6:在识别结果Ci的定位分布上,选择峰值Atop及其相邻两个值Atop-1及Atop+1,计算这三个值所在矩阵单元的统计均值,公式可以表示为:
其中,P表示矩阵纵坐标角度区间的分辨率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610893331.1/1.html,转载请声明来源钻瓜专利网。