[发明专利]单通道增强语音的处理方法、装置及可读存储介质有效
| 申请号: | 202110470353.8 | 申请日: | 2021-04-28 |
| 公开(公告)号: | CN113192528B | 公开(公告)日: | 2023-05-26 |
| 发明(设计)人: | 高飞;关海欣;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
| 主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通道 增强 语音 处理 方法 装置 可读 存储 介质 | ||
本发明提供一种单通道增强语音的处理方法,适用于语音增强技术领域,改方法包括:获取带有噪声的语音信号,并对所述带有噪声的语音信号进行分帧处理;根据短时离散余弦变换STDCT对分帧后的带有噪声的语音信号进行提取,得到第一特征;输入所述第一特征至训练模型中以得到目标模型,所述训练模型包括卷积神经网络CNN、长短时记忆网络LSTM和深度神经网络DNN;获取待处理语音信号,并对所述待处理语音信号进行分帧处理;根据短时离散余弦变换STDCT对分帧后的待处理语音信号进行提取,得到第二特征;输入所述第二特征至所述目标模型中以得到增强后的目标语音信号。通过上述方法能够降低噪音,得到增强后的目标语音信号。
【技术领域】
本发明涉及计算机技术领域,尤其涉及一种单通道增强语音的处理方法、装置及可读存储介质。
【背景技术】
单通道语音增强是前端信号处理的重要技术之一。其作用是在嘈杂的环境下能对噪声有效抑制,同时最大程度的恢复语音信号,让人或机器能够听到最干净的语音,这对于语音交互非常重要。
传统的单通道降噪技术处理平稳噪声的性能较好,但处理类似于敲击的冲击类噪声却是无能为力,且在低信噪比环境下的性能急剧下降。并且,现有的模型中计算量延时过大,并不能够应用于低功耗设备中。
因此,如何在低信噪比环境下得到增强语音信号,是本领域的技术难点之一。
【发明内容】
有鉴于此,本发明实施例提供了一种单通道增强语音的处理方法、装置及可读存储介质,用于准确确定目标的类型。
本发明一方面提供一种单通道增强语音的处理方法,所述单通道增强语音的处理方法包括:
获取带有噪声的语音信号,并对所述带有噪声的语音信号进行分帧处理;
根据短时离散余弦变换STDCT对分帧后的带有噪声的语音信号进行提取,得到第一特征;
输入所述第一特征至训练模型中以得到目标模型,所述训练模型包括卷积神经网络CNN、长短时记忆网络LSTM和深度神经网络DNN;
获取待处理语音信号,并对所述待处理语音信号进行分帧处理;
根据短时离散余弦变换STDCT对分帧后的待处理语音信号进行提取,得到第二特征;
输入所述第二特征至所述目标模型中以得到增强后的目标语音信号。
可选的,根据短时离散余弦变换STDCT对分帧后的带有噪声的语音信号进行提取,得到第一特征,包括:
其中,F(μ)表示所述短时离散余弦变换STDCT;f(x)表示所述带有噪声的语音信号的时域向量,N表示所述带有噪声的语音信号的时域向量的长度;并且,
c(μ)表示所述短时离散余弦变换STDCT的参数。
可选的,所述输入所述第一特征至训练模型中以得到目标模型,包括:
将所述第一特征作为输入信号输入至所述训练模型中以得到第一估计掩蔽值;
根据所述第一特征和所述第一估计掩蔽值计算得到第一估计纯净语音信号;
根据所述第一估计纯净语音信号训练所述训练模型以得到所述目标模型。
可选的,所述根据所述第一估计纯净语音信号训练所述训练模型以得到所述目标模型,包括:
根据干净语音信号和所述第一估计纯净语音信号计算所述训练模型的损失函数;
根据所述损失函数,调整所述训练模型参数以得到目标模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110470353.8/2.html,转载请声明来源钻瓜专利网。





