[发明专利]一种基于VAD和ANN的噪声消除方法有效
| 申请号: | 201710876421.4 | 申请日: | 2017-09-25 |
| 公开(公告)号: | CN107657961B | 公开(公告)日: | 2020-09-25 |
| 发明(设计)人: | 何志连;韩大强;李想 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/30 |
| 代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 刘兴亮;刘渝 |
| 地址: | 621000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 vad ann 噪声 消除 方法 | ||
1.一种基于VAD和ANN的噪声消除方法,其特征在于:首先用VAD技术将带噪语音分成语音帧和噪声帧,然后通过ANN对语音帧和噪声帧进行不同的降噪处理,对语音帧对应的参考噪声采取顺序训练,对噪声帧对应的参考噪声采取批训练;所述的VAD技术,是采用对数频谱距离来实现,包括以下几个步骤:
1)根据采样频率和噪声特性设置合适的帧长,把带噪语音和参考噪声进行加窗分帧处理;
2)根据实际情况设置合适的前导无语音时长,计算出前导无语音帧数,也就是初始噪声帧数NIS;
3)算出每帧带噪语音的对数频谱,用前导NIS帧带噪语音的对数频谱算出初始噪声的对数频谱;
4)算出每帧带噪语音与初始噪声的对数频谱距离,并与阈值相比较,小于阈值则判定为噪声帧,否则为语音帧。
2.根据权利要求1所述基于VAD和ANN的噪声消除方法,其特征在于:
步骤1)中,设置帧叠为M-1,M为ANN输入层神经元的个数。
3.根据权利要求2所述基于VAD和ANN的噪声消除方法,其特征在于:
步骤3)中,对数频谱和对数频谱距离计算方法如下:
其中,di(m)是第i帧带噪语音信号,Di(k)表示第i帧噪声的频谱,Xnoise(k)为初始噪声频谱,表示对带噪语音的频谱取模再取对数算出的的对数频谱,表示对和初始噪声的频谱取模再取对数算出的对数频谱,TH(i)表示对数频谱距离。
4.根据权利要求1所述基于VAD和ANN的噪声消除方法,其特征在于:
ANN采用的是线性神经网络的结构,包含1个输入层1个输出层,且不设置阈值。
5.根据权利要求1所述基于VAD和ANN的噪声消除方法,其特征在于:
对噪声帧对应的参考噪声采取批训练,是采用弹性搜索个体变步长算法,包括以下几个步骤:
1)读入一噪声帧数据作为线性神经网络的目标输出ti,其中N为输入层神经元的个数,下标i表示第i帧数据;读入对应的一帧参考噪声,并转化成输入样本集Xi;
t1=[d1(1),d1(2),…,d1(M)]T
X1=[x1(1),x1(2),…,x1(M)]
x1(1)=[x1(1),0,…,0]T
x1(2)=[x1(2),x1(1),0,…,0]T
x1(N)=[x1(N),x1(N-1),…,x1(1)]T
x1(M)=[x1(M),x1(M-1),…,x1(M-N+1)]T
ti=[di(N),di(N+1),…,di(M)]T,i=2,3,4,…
Xi=[xi(1),xi(2),…,xi(M-N+1)]
xi(1)=[xi(N),xi(N-1),…,xi(1)]T
xi(M-N+1)=[xi(M),xi(M-1),…,xi(M-N+1)]T
2)设置步长增大系数a=1.2,步长减小系数为b=0.5;对每一噪声帧训练时都初始化步长向量ηi(0)=0.01×ones(N,1),对第1噪声帧初始化权值向量w1(0)=0.01×randn(N,1),对第i(i>1)噪声帧初始化权值向量为前一帧训练的结果;其中,ones(N,1)表示N行1列的元素为1的矩阵,randn(N,1)表示产生标准正态分布的随机数或矩阵的函数;
3)设置训练终止条件,根据一帧语音的时长和硬件条件在满足实时处理条件下设置合适的最大迭代次数train_num,根据降噪需要达到的效果设置合适的梯度范数最小值min_grad,均方误差E(k)的最小值error_goal;
4)读入样本集,求出均方误差E(k),然后求解均方误差对各权值的偏导,保留其方向为cj(k);当cj(k)cj(k-1)<0时前后两次第j个梯度分量的方向相反,则减小对应的步长分量;当cj(k)cj(k-1)>0时前后两次第j个梯度分量的方向相同,则增大对应的步长分量;当cj(k)cj(k-1)=0时前后两次至少有一次第j个梯度分量为零,则保持对应的步长分量不变;
p表示样本个数
5)根据梯度和步长修正各权值,判断是否满足终止条件;当达到最大迭代次数tain_num,或者达到梯度范数最小值min_grad,或者均方误差E(k)达到最小值error_goal,输出结果,结束这帧数据的处理;否则进行下一次迭代。
6.根据权利要求1所述基于VAD和ANN的噪声消除方法,其特征在于:
对语音帧的参考噪声采取顺序训练方式,采用变步长的LMS算法,步长η调整如下,其中α=1/256,β=-11,yy(0)=0;
yy(p)=αx(p)+(1-α)yy(p-1)
yyl(p)=max{yy(p),0.001}
η(p)=2β/yyl(p)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710876421.4/1.html,转载请声明来源钻瓜专利网。





