[发明专利]基于噪声背景分类的语音增强方法及系统在审
申请号: | 202110459982.0 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113160844A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 李晔;冯涛;张鹏;李姝;汪付强 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/18;G10L25/24;G10L15/02;G10L15/06;G10L15/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 噪声 背景 分类 语音 增强 方法 系统 | ||
1.基于噪声背景分类的语音增强方法,其特征是,包括:
获取待处理语音信号;
对待处理语音信号进行特征提取;
将提取的特征,输入到训练后的分类器中,得到待处理语音的噪声背景标签;
根据噪声背景标签,选择对应标签的训练后的生成器;
将待处理的语音信号,输入到被选中的训练后的生成器中,得到增强后的语音信号。
2.如权利要求1所述的基于噪声背景分类的语音增强方法,其特征是,对待处理语音信号进行特征提取;具体包括:
对待处理语音信号,提取梅尔频率倒谱系数特征。
3.如权利要求1所述的基于噪声背景分类的语音增强方法,其特征是,将提取的特征,输入到训练后的分类器中,得到待处理语音的噪声背景标签;其中,训练后的分类器,训练步骤包括:
构建第一训练集,所述第一训练集为已知噪声背景标签的语音信号特征;
将训练集输入到分类器中,对分类器进行训练;
当分类器的损失函数得到最小值或者训练达到迭代次数时,停止训练,得到训练后的分类器。
4.如权利要求1所述的基于噪声背景分类的语音增强方法,其特征是,根据噪声背景标签,选择对应标签的训练后的生成器;其中,训练后的生成器,具体训练步骤包括:
(1)构建第二训练集;所述第二训练集,包括:无噪声语音信号和已知噪声背景标签的带噪声语音信号;其中,已知噪声背景标签的带噪声语音信号,是通过对无噪声语音信号添加对应标签的背景噪声得到的;
(2)重复鉴别器初始化步骤、生成器初始化步骤和优化权值步骤三个步骤;
首次执行时,鉴别器初始化步骤和生成器初始化步骤,均使用正态分布的随机数对权值进行赋值;
非首次执行时,鉴别器初始化步骤和生成器初始化步骤,使用上一次优化权值步骤中的优化器优化后的权重;
(3)判断当前已训练数据个数是否大于设定值,重复进行训练,直到达到设定的训练个数;训练完成后保存优化权值步骤中最后一层权重;得到训练后的生成器。
5.如权利要求4所述的基于噪声背景分类的语音增强方法,其特征是,所述鉴别器初始化步骤;具体包括:
首次执行时,使用正态分布的随机数对权值进行赋值;将预处理后的无噪声语音输入鉴别器,鉴别器将输出为1,表示此类输入为无噪声语音;
非首次执行时,使用上一次优化权值步骤中的优化器优化后的权重;将无噪声语音和生成器处理后的带噪声语音输入到鉴别器中,鉴别器输出鉴别结果。
6.如权利要求4所述的基于噪声背景分类的语音增强方法,其特征是,所述生成器初始化步骤;具体包括:
首次执行时,使用正态分布的随机数对权值进行赋值;将预处理后的带噪声语音输入生成器,编码结构将预处理后的带噪声语音进行压缩,再由解码结构进行反压缩,并通过跳跃连接将带噪声语音中语音特征从编码结构送入解码结构内来指导解码结构生成增强语音;
非首次执行时,使用上一次优化权值步骤中的优化器优化后的权重;将预处理后的带噪语音输入生成器,编码结构首先会将预处理后的带噪语音进行压缩,再由解码结构进行反压缩,并通过跳跃连接将带噪语音中语音特征从编码结构送入解码结构内来指导解码结构生成增强语音。
7.如权利要求4所述的基于噪声背景分类的语音增强方法,其特征是,所述优化权值步骤;具体包括:
生成对抗网络内的优化器根据由增强语音与无噪声语音求取的生成器的损失值和鉴别器的损失值,通过梯度下降来对生成器内各个编码结构与解码结构的卷积核的权重进行更新,从而生成与无噪声语音相比更加相似的增强语音;同时优化器也更新鉴别器内的权重,来增强鉴别器识别增强语音的能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110459982.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种环构LDPC码构造方法
- 下一篇:代码编辑方法、装置