[发明专利]一种基于卷积神经网络的异常声音信号识别方法在审
| 申请号: | 201811350942.7 | 申请日: | 2018-11-14 |
| 公开(公告)号: | CN109473120A | 公开(公告)日: | 2019-03-15 |
| 发明(设计)人: | 姜彦吉;荆德吉;葛少成;郭羽含 | 申请(专利权)人: | 辽宁工程技术大学 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G06N3/08;G06N3/04 |
| 代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 刘晓岚 |
| 地址: | 125105 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 卷积神经网络 异常声音 信号识别 样本声音 样本 预处理 代价函数计算 反向传播 权值向量 声音特征 实际输出 输入测试 信号分类 连接层 训练集 二维 和频 算法 维度 标签 采集 验证 传递 更新 监督 学习 | ||
1.一种基于卷积神经网络的异常声音信号识别方法,其特征在于:包括以下步骤:
步骤1、通过语音采集系统对声音进行采集,利用现有的异常声音库,共采集爆炸声、建筑坍塌声、撞击声、警报声、铃声、呼救声6种异常声音,每种声音采集N个样本,共采集6N个样本,构成样本声音库,其中包括五种不同的信噪比,分别为0dB、5dB、10dB、15dB与无噪声;并将采集的样本利用babble噪声形成带噪样本;
将这些带噪样本分为测试集与训练集两部分,根据五种不同的信噪比,分别对每种声音随机抽取70%作为卷积神经网络中的训练集,随机抽取50%作为网络中的测试集;
步骤2、对样本声音库中的声音进行预处理;利用动态时间规整方法将样本声音库中所有异常声音规整为相同帧数,选择帧长256个采样点,帧移为128个采样点以及汉明窗进行分帧加窗操作,每一帧提取36维MFCC特征参数,其中包括MFCC系数、ΔMFCC和ΔΔMFCC,保证异常样本数量的特征向量排列成为相同的特征图输入到卷积神经网络;
步骤3、将步骤2预处理的异常声音信号按照在时间和频域两个维度上排列成为二维的声音特征图,作为卷积神经网络模型的输入,具体方法为:
步骤3.1、将训练集中的声音特征图进行卷积运算操作,将2*2卷积核从左上端开始卷积,每次操作完成后,根据步长为1开始卷积操作,直至遍历整个声音特征图,最后得到一个二维的卷积特征图;
所述卷积层第l层的j个特征图的输出函数如下公式所示:
其中,l表示第l层,即为当前层,l-1即表示前一层;表示第l层的排列顺序为j的特征图;wi,j表示当前层与前一层特征图的卷积核;表示当前层的排列顺序为j的特征图的偏置;表示前一层第i个特征图;θ()为激励函数;M表示当前层特征图个数;表示当前层第j个特征图连接前一层特征图的数量;
步骤3.2、利用最大值采样方法对步骤3.1得到的卷积特征图进行处理,减少卷积特征图的参数数量,如下公式所示:
其中,Ri表示第i个子采样区域,ai表示在Ri范围内的特征图,Si为第i个子采用区域的最大值;最大子采样法是挑选概率值ai中最大的值作为最终的子采样结果;
步骤3.3、重复步骤3.1与3.2,得到最终的子采样结果,并通过全连接层将子采样结果中的二维向量转化为一维向量;
所述全连接层的输入公式如下公式所示:
Hw,b(x)=δ(WTx+b)
其中,Hw,b(x)表示全连接层的输出,x表示全连接层输入的一个特征向量,W为全连接层的权值向量;b表示偏置向量,δ()表示全连接层的激励函数,如下公式所示:
步骤3.4、将全连接层中的一维向量输入到Softmax分类器中,得到六个预测值,作为最终的分类结果;
步骤4、使用代价函数计算训练集的实际输出结果与标签结果之间的误差,利用反向传播算法传递差值,并通过权值更新公式更新卷积神经网络的全连接层中的权值向量W,如下公式所示:
其中,J(W,b)表示代价函数,hw,b(xij)表示样本的实际输出值,yi为该样本的标签值,m表示训练集中的语音信号数量,xij表示语音信号中的幅值;
使用监督学习方法训练卷积神经网络模型,训练完后,保存训练完成的网络模型,设定监督学习方法的迭代次数为10次;
步骤5、输入测试集中的数据,计算出识别率,验证卷积神经网络模型的准确性。
2.根据权利要求1所述的一种基于卷积神经网络的异常声音信号识别方法,其特征在于:步骤1所述将采集的样本利用babble噪声形成带噪样本,加噪公式如下公式所示:
f(t)=h1*S(t)+h2*n(t)
其中,f(t)表示带噪声音信号,S(t)表示未带噪声音信号,n(t)表示babble噪声,h1、h2均为根据信噪比来决定的混合矩阵,*表示线性卷积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811350942.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种声学目标事件监控方法
- 下一篇:语音合成质量测试方法及装置





