[发明专利]一种基于残差网络的环境声音识别系统及方法在审

专利信息
申请号: 202110628210.5 申请日: 2021-06-07
公开(公告)号: CN113345427A 公开(公告)日: 2021-09-03
发明(设计)人: 刘亚荣;于顼顼;谢晓兰;肖博怀 申请(专利权)人: 桂林理工大学
主分类号: G10L15/06 分类号: G10L15/06;G10L15/16;G10L21/02;G10L21/0316
代理公司: 暂无信息 代理人: 暂无信息
地址: 541004 广西壮*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 网络 环境 声音 识别 系统 方法
【权利要求书】:

1.一种基于残差网络的环境声音识别系统,其特征在于,包括:数据输入模块、声音信号增强模块、预处理模块、特征提取模块、训练残差网络模型模块和模型库模块;声音信号增强模块包括时移增强子模块和高变换增强子模块,预处理模块包括预加重模块和分帧加窗模块;

所述数据输入模块,用于输入训练和识别的声音数据样本;

所述声音信号增强模块,用于增强输入的声音数据样本,使数据样本更具可读性,包括时移增强子模块和音高变换增强子模块;

所述时移增强子模块用于沿着时间轴对声音信号移位,达到数据增强的功能;

所述音高变换增强子模块,用于围绕频率轴对声音信号进行环绕式转换,达到数据增强的功能;

所述预处理模块,用于处理数据样本,将数据样本划分为若干帧,便于后面对数据的进一步处理;

所述预加重子模块:用于提升声音信号的高频部分,得到更加平坦的频谱;

所述分帧加窗子模块:用于将声音信号分为若干20ms的帧,并对每一帧进行加窗处理;

所述特征提取模块,用于环境声音信号特征的提取;

所述训练残差网络模型模块,用于残差网络的训练,将提取的环境声音特征输入即可进行训练;

所述模型库模块,用于识别新输入的、未经训练的数据样本,可输出识别结果。

2.一种基于残差网络的环境声音识别方法,其特征在于,包括如下步骤:

步骤S1:划分于训练和用于测试的数据样本,使每一种类型的声音都参与训练;

步骤S2:将所述步骤S1输入的数据样本进行信号增强处理,突出每种声音信号的特点;

步骤S3:将所述步骤S2增强后的数据样本进行预处理,将声音分为若干大小相同的帧,后续的处理是以帧为单位进行的;

步骤S4:将所述步骤S3预处理后的数据样本进行特征提取;

步骤S5:将所述步骤S4提取的声音特征输入到残差网络模型当中,并对残差网络模型进行训练;

步骤S6:所述步骤S5之后,就可以得到一个残差网络模型库,可用于识别未经训练的声音数据样本,并输出别结果。

3.根据权利要求2所述的一种环境声音识别方法,其特征在于,所述步骤S2声音信号增强还包括如下步骤:

步骤S21:时移增强,声音信号会在时间维度上压缩或扩展;

步骤S22:音高变换增强,声音信号会在频率维度上压缩或扩展。

4.根据权利要求2所述的一种环境声音识别方法,其特征在于,所述步骤S3预处理还包括如下步骤:

步骤S31:对声音进行预加重处理,采取的措施是用数字滤波器实现预加重,预加重网络的输出和输入的语音信号s(n)的关系如公式(1)所示:

式中,a为预加重系数,本方法中取a=0.9375;

步骤S32:由于环境声音是非平稳信号,而非平稳信号不便于处理,因此将所述步骤S31得到的每一段声音分为若干个小帧,在每一帧中,声音可以看做平稳信号,即具有短时平稳性,每一帧的帧长为20ms;分帧之后,需要对每一帧进行加窗处理,即每一帧乘一个窗函数,本方法使用的是汉明窗,如公式(2)所示。

5.根据权利要求2所述的一种环境声音识别方法,其特征在于,所述步骤S4特征提取还包括如下步骤:

步骤S41:对声音信号进行快速傅里叶变换,即取声音信号的频谱,如式(3)所示;

式中,x(n)表示输入的声音信号,N表示傅里叶变换的点数;

步骤S42:对声音信号的频谱取模的平方,得到功率谱,如公式(4)所示;

式中,N为傅里叶变换的点数,xi表示信号x的第i帧;

步骤S43:将功率谱通过梅尔滤波器进行滤波,梅尔滤波器由40个三角滤波器组成,每个相邻三角窗是相互重叠的;将频率转换为梅尔刻度的公式如式(5)所示:

式中,Mel(f)表示最终频率,f表示实际频率;

步骤S44:对S43输出取对数,即进行倒谱计算,从而凸显低能量部分的能量差异,同时对纵轴实行放缩处理;其中,计算每个滤波器输出的对数能量的方法如公式(6)所示;

式中,Hm(k)表示三角滤波器的输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林理工大学,未经桂林理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110628210.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top