[发明专利]一种基于残差网络的环境声音识别系统及方法在审
申请号: | 202110628210.5 | 申请日: | 2021-06-07 |
公开(公告)号: | CN113345427A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 刘亚荣;于顼顼;谢晓兰;肖博怀 | 申请(专利权)人: | 桂林理工大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L21/02;G10L21/0316 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 环境 声音 识别 系统 方法 | ||
1.一种基于残差网络的环境声音识别系统,其特征在于,包括:数据输入模块、声音信号增强模块、预处理模块、特征提取模块、训练残差网络模型模块和模型库模块;声音信号增强模块包括时移增强子模块和高变换增强子模块,预处理模块包括预加重模块和分帧加窗模块;
所述数据输入模块,用于输入训练和识别的声音数据样本;
所述声音信号增强模块,用于增强输入的声音数据样本,使数据样本更具可读性,包括时移增强子模块和音高变换增强子模块;
所述时移增强子模块用于沿着时间轴对声音信号移位,达到数据增强的功能;
所述音高变换增强子模块,用于围绕频率轴对声音信号进行环绕式转换,达到数据增强的功能;
所述预处理模块,用于处理数据样本,将数据样本划分为若干帧,便于后面对数据的进一步处理;
所述预加重子模块:用于提升声音信号的高频部分,得到更加平坦的频谱;
所述分帧加窗子模块:用于将声音信号分为若干20ms的帧,并对每一帧进行加窗处理;
所述特征提取模块,用于环境声音信号特征的提取;
所述训练残差网络模型模块,用于残差网络的训练,将提取的环境声音特征输入即可进行训练;
所述模型库模块,用于识别新输入的、未经训练的数据样本,可输出识别结果。
2.一种基于残差网络的环境声音识别方法,其特征在于,包括如下步骤:
步骤S1:划分于训练和用于测试的数据样本,使每一种类型的声音都参与训练;
步骤S2:将所述步骤S1输入的数据样本进行信号增强处理,突出每种声音信号的特点;
步骤S3:将所述步骤S2增强后的数据样本进行预处理,将声音分为若干大小相同的帧,后续的处理是以帧为单位进行的;
步骤S4:将所述步骤S3预处理后的数据样本进行特征提取;
步骤S5:将所述步骤S4提取的声音特征输入到残差网络模型当中,并对残差网络模型进行训练;
步骤S6:所述步骤S5之后,就可以得到一个残差网络模型库,可用于识别未经训练的声音数据样本,并输出别结果。
3.根据权利要求2所述的一种环境声音识别方法,其特征在于,所述步骤S2声音信号增强还包括如下步骤:
步骤S21:时移增强,声音信号会在时间维度上压缩或扩展;
步骤S22:音高变换增强,声音信号会在频率维度上压缩或扩展。
4.根据权利要求2所述的一种环境声音识别方法,其特征在于,所述步骤S3预处理还包括如下步骤:
步骤S31:对声音进行预加重处理,采取的措施是用数字滤波器实现预加重,预加重网络的输出和输入的语音信号s(n)的关系如公式(1)所示:
式中,a为预加重系数,本方法中取a=0.9375;
步骤S32:由于环境声音是非平稳信号,而非平稳信号不便于处理,因此将所述步骤S31得到的每一段声音分为若干个小帧,在每一帧中,声音可以看做平稳信号,即具有短时平稳性,每一帧的帧长为20ms;分帧之后,需要对每一帧进行加窗处理,即每一帧乘一个窗函数,本方法使用的是汉明窗,如公式(2)所示。
5.根据权利要求2所述的一种环境声音识别方法,其特征在于,所述步骤S4特征提取还包括如下步骤:
步骤S41:对声音信号进行快速傅里叶变换,即取声音信号的频谱,如式(3)所示;
式中,x(n)表示输入的声音信号,N表示傅里叶变换的点数;
步骤S42:对声音信号的频谱取模的平方,得到功率谱,如公式(4)所示;
式中,N为傅里叶变换的点数,xi表示信号x的第i帧;
步骤S43:将功率谱通过梅尔滤波器进行滤波,梅尔滤波器由40个三角滤波器组成,每个相邻三角窗是相互重叠的;将频率转换为梅尔刻度的公式如式(5)所示:
式中,Mel(f)表示最终频率,f表示实际频率;
步骤S44:对S43输出取对数,即进行倒谱计算,从而凸显低能量部分的能量差异,同时对纵轴实行放缩处理;其中,计算每个滤波器输出的对数能量的方法如公式(6)所示;
式中,Hm(k)表示三角滤波器的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林理工大学,未经桂林理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110628210.5/1.html,转载请声明来源钻瓜专利网。