[发明专利]一种基于残差网络的环境声音识别系统及方法在审

专利信息
申请号: 202110628210.5 申请日: 2021-06-07
公开(公告)号: CN113345427A 公开(公告)日: 2021-09-03
发明(设计)人: 刘亚荣;于顼顼;谢晓兰;肖博怀 申请(专利权)人: 桂林理工大学
主分类号: G10L15/06 分类号: G10L15/06;G10L15/16;G10L21/02;G10L21/0316
代理公司: 暂无信息 代理人: 暂无信息
地址: 541004 广西壮*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 网络 环境 声音 识别 系统 方法
【说明书】:

发明公开了一种基于残差网络的环境声音识别系统及方法,包括:数据输入模块、声音信号增强模块、预处理模块、特征提取模块、训练残差网络模块和模型库模块。本发明采用声音信号增强技术对数据样本作增强处理,凸显了数据样本的特征;预处理将声音样本分割为短时平稳的帧;采用FBank特征提取方法提取声音的深层次特征,并将时域信号转化为频域信号,FBank利用高维度特征的相关性,比梅尔频率倒谱系数更适合神经网络模型的训练;残差网络凭借其特殊的残差块结构可以避免随着网络加深而带来的网络退化、梯度消失和梯度爆炸的问题,从而优化网络模型,提升模型的泛化能力,从而提升环境声音的识别率,和传统的环境声音识别方法相比,有很大的提升。

技术领域

本发明涉及声音信号处理领域,特别涉及一种基于残差网络的环境声音识别系统及方法。

背景技术

环境声音随处可见,其利用价值也是非常高,承载了许多信息。在很多领域具有重要的意义,例如机器故障诊断、地震预测、自动驾驶声音环境感知、家庭保健检测系统等。特别是进入21世纪,随着人工智能的不断发展,深度学习被广泛应用于许多智能领域,各种深度学习方法使得环境声音识别的精度被大大提高。

在众多环境声音识别方法中,还存在很多不足:

(1)早期的环境声音识别方法主要包括:支持向量机、随机森林、K最近邻、HMM-GMM等。这些方法是比较传统的声音识别方法,只能提取较为浅层的声音特征,而无法提取更深层次的声音特征,所以在识别率方面表现较差。

(2)目前使用比较多的声音特征提取方法为线性预测分析、感知线性预测系数、线性预测倒谱系数、梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC),其中最常用的是MFCC。MFCC舍弃了高维度数据的相关性,将信号映射到低维空间,虽然在使用对角协方差矩阵的高斯混合模型中表现较好,但是对于神经网络模型这种可以提取深层次特征的模型来说,不能充分发挥神经网络模型的性能。

(3)人工智能不断发展,使得很多深度学习方法被用于环境声音识别,如深度神经网络、卷积神经网络、循环神经网络,但是这些网络模型普遍存在一个问题:随着网络深度的增加,网络模型容易出现网络退化、梯度消失和梯度爆炸的情况,从而影响环境声音识别率的提升。

由此可见,目前环境声音识别方法还不够成熟,一种基于残差网络的环境声音识别系统及方法是本领域技术人员亟需解决的问题。

发明内容

有鉴于此,本发明提供了一种基于残差网络的环境声音识别系统及方法,首先将采集到的声音数据作一些预处理,然后使用滤波器组(Filter Bank,FBank) 作为声音信号的特征提取方法,并将提取的特征输入到残差网络模型之中进行训练,从而形成一个残差网络模型库,用于识别未经训练的环境声音数据集。

为了实现上述目的,本发明采用如下技术方案:一种基于残差网络的环境声音识别系统,包括:数据输入模块、声音信号增强模块、预处理模块、特征提取模块、训练残差网络模型模块和模型库模块;声音信号增强模块包括时移增强子模块和高变换增强子模块,预处理模块包括预加重模块和分帧加窗模块。

所述数据输入模块,用于输入训练和识别的声音数据样本。

所述声音信号增强模块,用于增强输入的声音数据样本,使数据样本更具可读性,包括时移增强子模块和音高变换增强子模块。

所述时移增强子模块用于沿着时间轴对声音信号移位,达到数据增强的功能。

所述音高变换增强子模块,用于围绕频率轴对声音信号进行环绕式转换,达到数据增强的功能。

所述预处理模块,用于处理数据样本,将数据样本划分为若干帧,便于后面对数据的进一步处理。

所述预加重子模块:用于提升声音信号的高频部分,得到更加平坦的频谱;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林理工大学,未经桂林理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110628210.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top