[发明专利]一种基于BP网络的噪声分类方法有效
申请号: | 201910960086.5 | 申请日: | 2019-10-10 |
公开(公告)号: | CN110827844B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 张涛;耿彦章;邵洋洋 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/24;G10L25/27;G10L25/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bp 网络 噪声 分类 方法 | ||
一种基于BP网络的噪声分类方法:对输入的噪声信号进行预处理;对预处理后的每一帧噪声信号分别进行傅里叶变换得到噪声信号功率谱;利用每一帧噪声信号功率谱分别计算每一帧噪声信号的梅尔频率倒谱系数及梅尔频率倒谱系数的一阶差分;计算每一帧噪声信号的伽玛通频率倒谱系数;将每一帧噪声信号的梅尔频率倒谱系数、梅尔频率倒谱系数的一阶差分和伽玛通频率倒谱系数组合作为该帧噪声信号的联合特征,将全部帧噪声信号的联合特征中的一部分作为训练数据,另一部分作为测试数据;分别训练一级BP网络和二级BP网络;将一级BP网络和二级BP网络联合进行测试,得到最终的噪声信号分类结果。本发明有着更高的噪声分类准确率。
技术领域
本发明涉及一种噪声分类方法。特别是涉及一种基于BP网络的噪声分类方法。
背景技术
在语音信号的处理过程中,噪声污染的问题不可避免。随着数字语音信号在科研和生活中的广泛应用,噪声对数字语音信号的影响愈发明显,如何有效地抑制噪声,提高语音信号的质量和可懂度成为众多学者研究的热点。而在语音增强技术中,一大研究难点则是噪声的来源众多。不同噪声的统计特性不尽相同,因此在实际应用中,为了达到更好的信号处理效果,需根据应用场合,对不同噪声特性的噪声进行区别处理。
一般来说,解决噪声分类问题的关键技术点主要有两个,一是要提取何种特征用于噪声类型的区分;二是对提取的特征运用何种分类技术。对于第一个关键技术点,目前常用的噪声特征有自适应子波特征、短时自相关函数(Short Auto-correlation Function,SACF)、bark域能量分布、梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)、一阶差分梅尔倒谱系数(first-order MFCC,ΔMFCC)、离散傅里叶系数、线性预测编码系数以及伽马通滤波器系数等。对于噪声分类方法,目前常用的技术包括基于隐马尔科夫模型(Hidden Markov Model,HMM)的噪声分类算法、基于混合高斯模型(Gaussian MixtureModel,GMM)的噪声分类算法、基于支持向量机(Support Vector Machine,SVM)的噪声分类算法以及基于神经网络的噪声分类算法等。
然而目前所提出噪声分类方法存在分类准确低的情况。由于噪声分类的准确性能会直接影响信号处理的性能,那么提出一种高准确的噪声分类方法则成为了信号处理领域的一个新挑战。
发明内容
本发明所要解决的技术问题是,提供一种具有更高分类准确率的基于BP网络的噪声分类方法。
本发明所采用的技术方案是:一种基于BP网络的噪声分类方法,包括如下步骤:
1)对输入的噪声信号进行预处理,包括分帧以及加窗处理;
2)对预处理后的每一帧噪声信号分别进行傅里叶变换得到噪声信号功率谱;
3)利用所述的每一帧噪声信号功率谱分别计算每一帧噪声信号的梅尔频率倒谱系数及梅尔频率倒谱系数的一阶差分;
4)计算每一帧噪声信号的伽玛通频率倒谱系数;
5)将每一帧噪声信号的梅尔频率倒谱系数、梅尔频率倒谱系数的一阶差分和伽玛通频率倒谱系数组合作为该帧噪声信号的联合特征,将全部帧噪声信号的联合特征中的一部分作为训练数据,另一部分作为测试数据;
6)训练一级BP网络;
7)训练二级BP网络;
8)将一级BP网络和二级BP网络联合进行测试,得到最终的噪声信号分类结果。
步骤2)是采用如下公式对每一帧噪声信号进行傅里叶变换:
X(i,k)=FFT[xi(n)]
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910960086.5/2.html,转载请声明来源钻瓜专利网。