[发明专利]一种基于语谱图纹理特征的音频场景识别方法在审
| 申请号: | 202010091722.8 | 申请日: | 2020-01-22 | 
| 公开(公告)号: | CN111276158A | 公开(公告)日: | 2020-06-12 | 
| 发明(设计)人: | 徐翘楚;汪斌;陈淑聪;姜飞龙;朱海滨;李兴隆;张奥;毛凌航 | 申请(专利权)人: | 嘉兴学院 | 
| 主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/51 | 
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 | 
| 地址: | 314000 浙江省嘉兴市*** | 国省代码: | 浙江;33 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 语谱图 纹理 特征 音频 场景 识别 方法 | ||
1.一种基于语谱图纹理特征的音频场景识别方法,其特征在于该方法的具体步骤是:
步骤(1):将输入音频集随机划分成训练音频和测试音频;
步骤(2):将输入训练音频和测试音频提取出语谱图,并进行规范化处理;
步骤(3):采用二维Gabor滤波器对训练音频和测试音频的语谱图进行变换,具体如下:
建立L个二维Gabor滤波器,二维Gabor滤波器有M个尺度和N个方向。因此有L=M×N;若输入音频语谱图为D(x,y),x=1,2,...,W,y=1,2,...,H;其中W和H分别为语谱图的宽度和高度;经过二维Gabor滤波后,得到Gabor系数为G(m,n,i,j),其中m为Gabor系数的尺度索引;n为Gabor系数的方向索引;0≤m≤M-1,0≤n≤N-1;
L个二维Gabor滤波器的设计步骤如下:
对于二维离散Gabor滤波器,有如下公式:
x′=x cosθn+y sinθn
y′=y cosθn-x sinθn
θn=2πn/N,其中n=0,1,...,N-1,fm=a-mfmax,其中fmax为最高频率,m=0,1,...,M-1;
构造L=M×N个Gabor滤波器后,将输入音频频谱图经过L个Gabor滤波器进行滤波,得到Gabor系数G(m,n,x,y),计算公式如下:
G(m,n,x,y)=D(x,y)*f(x,y,fm,θn)
其中,D(x,y)为输入音频语谱图,f(x,y,fm,θn)为第m个尺度和第n个方向的Gabor滤波器,符号*为卷积操作,G(x,y,m,n)为音频语谱图经Gabor滤波后得到的Gabor滤波结果;
步骤(4):求取Gabor滤波结果G(m,n,x,y)的幅度,采用公式如下:
其中,A(m,n,x,y)为Gabor滤波结果幅度;RE(G(m,n,x,y))为Gabor滤波结果G(x,y,m,n)的实部;IM(G(m,n,x,y))为Gabor滤波结果G(x,y,m,n)的虚部;
步骤(5):对音频频谱图的不同尺度的Gabor滤波结果幅度A(m,n,x,y)求取像素距离d=1,方向为θ=0°,θ=45°,θ=90°和θ=135°四个方向的灰度共生矩阵,具体是:
将Gabor滤波结果幅度A(m,n,x,y)的取值归一化到[0,255]范围,同时计算方向为θ=0°,θ=45°,θ=90°和θ=135°四个方向的灰度共生矩阵,记为CM0(p,q)、CM45(p,q)、CM90(p,q)和CM135(p,q),其中0≤p≤255,0≤q≤255;
步骤(6):计算得到四个方向灰度共生矩阵的归一化矩阵,具体计算公式如下:
步骤(7):对四个方向的灰度共生矩阵计算二阶矩、熵、对比度和均匀度,计算方法如下:
二阶矩计算公式为:
其中θ=0°,45°,90°,135°;
熵计算公式为:
其中θ=0°,45°,90°,135°;
对比度计算公式为:
其中θ=0°,45°,90°,135°;
均匀度计算公式为:
其中θ=0°,45°,90°,135°;
步骤(8):将四个方向的二阶矩,熵,对比度和均匀度组合成特征向量,公式如下:
F={WM0,WM45,WM90,WM135,WE0,WE45,WE90,WE135,
WC0,WC45,WC90,WC135,WH0,WH45,WH90,WH135}
步骤(9):将特征向量F合并音频场景类别送到支持向量机中进行训练,得到训练后的支持向量机;
步骤(10):将测试音频同样按步骤(1)到步骤(8)提取出特征向量F,送到训练后的支持向量机中进行测试,得到音频场景分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于嘉兴学院,未经嘉兴学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010091722.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于视觉的产品缺陷检测装置
 - 下一篇:一种显示屏及其制备方法和显示装置
 





