[发明专利]一种基于语谱图纹理特征的音频场景识别方法在审

专利信息
申请号: 202010091722.8 申请日: 2020-01-22
公开(公告)号: CN111276158A 公开(公告)日: 2020-06-12
发明(设计)人: 徐翘楚;汪斌;陈淑聪;姜飞龙;朱海滨;李兴隆;张奥;毛凌航 申请(专利权)人: 嘉兴学院
主分类号: G10L25/03 分类号: G10L25/03;G10L25/51
代理公司: 暂无信息 代理人: 暂无信息
地址: 314000 浙江省嘉兴市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 语谱图 纹理 特征 音频 场景 识别 方法
【权利要求书】:

1.一种基于语谱图纹理特征的音频场景识别方法,其特征在于该方法的具体步骤是:

步骤(1):将输入音频集随机划分成训练音频和测试音频;

步骤(2):将输入训练音频和测试音频提取出语谱图,并进行规范化处理;

步骤(3):采用二维Gabor滤波器对训练音频和测试音频的语谱图进行变换,具体如下:

建立L个二维Gabor滤波器,二维Gabor滤波器有M个尺度和N个方向。因此有L=M×N;若输入音频语谱图为D(x,y),x=1,2,...,W,y=1,2,...,H;其中W和H分别为语谱图的宽度和高度;经过二维Gabor滤波后,得到Gabor系数为G(m,n,i,j),其中m为Gabor系数的尺度索引;n为Gabor系数的方向索引;0≤m≤M-1,0≤n≤N-1;

L个二维Gabor滤波器的设计步骤如下:

对于二维离散Gabor滤波器,有如下公式:

x′=x cosθn+y sinθn

y′=y cosθn-x sinθn

θn=2πn/N,其中n=0,1,...,N-1,fm=a-mfmax,其中fmax为最高频率,m=0,1,...,M-1;

构造L=M×N个Gabor滤波器后,将输入音频频谱图经过L个Gabor滤波器进行滤波,得到Gabor系数G(m,n,x,y),计算公式如下:

G(m,n,x,y)=D(x,y)*f(x,y,fm,θn)

其中,D(x,y)为输入音频语谱图,f(x,y,fm,θn)为第m个尺度和第n个方向的Gabor滤波器,符号*为卷积操作,G(x,y,m,n)为音频语谱图经Gabor滤波后得到的Gabor滤波结果;

步骤(4):求取Gabor滤波结果G(m,n,x,y)的幅度,采用公式如下:

其中,A(m,n,x,y)为Gabor滤波结果幅度;RE(G(m,n,x,y))为Gabor滤波结果G(x,y,m,n)的实部;IM(G(m,n,x,y))为Gabor滤波结果G(x,y,m,n)的虚部;

步骤(5):对音频频谱图的不同尺度的Gabor滤波结果幅度A(m,n,x,y)求取像素距离d=1,方向为θ=0°,θ=45°,θ=90°和θ=135°四个方向的灰度共生矩阵,具体是:

将Gabor滤波结果幅度A(m,n,x,y)的取值归一化到[0,255]范围,同时计算方向为θ=0°,θ=45°,θ=90°和θ=135°四个方向的灰度共生矩阵,记为CM0(p,q)、CM45(p,q)、CM90(p,q)和CM135(p,q),其中0≤p≤255,0≤q≤255;

步骤(6):计算得到四个方向灰度共生矩阵的归一化矩阵,具体计算公式如下:

步骤(7):对四个方向的灰度共生矩阵计算二阶矩、熵、对比度和均匀度,计算方法如下:

二阶矩计算公式为:

其中θ=0°,45°,90°,135°;

熵计算公式为:

其中θ=0°,45°,90°,135°;

对比度计算公式为:

其中θ=0°,45°,90°,135°;

均匀度计算公式为:

其中θ=0°,45°,90°,135°;

步骤(8):将四个方向的二阶矩,熵,对比度和均匀度组合成特征向量,公式如下:

F={WM0,WM45,WM90,WM135,WE0,WE45,WE90,WE135

WC0,WC45,WC90,WC135,WH0,WH45,WH90,WH135}

步骤(9):将特征向量F合并音频场景类别送到支持向量机中进行训练,得到训练后的支持向量机;

步骤(10):将测试音频同样按步骤(1)到步骤(8)提取出特征向量F,送到训练后的支持向量机中进行测试,得到音频场景分类结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于嘉兴学院,未经嘉兴学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010091722.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top