[发明专利]一种基于联合字典学习和稀疏表示的单通道语音增强方法有效

专利信息
申请号: 202010454159.6 申请日: 2020-05-26
公开(公告)号: CN111508518B 公开(公告)日: 2022-05-13
发明(设计)人: 叶中付;穆罕默德绍希杜尔·伊斯兰姆 申请(专利权)人: 中国科学技术大学
主分类号: G10L21/0216 分类号: G10L21/0216;G10L25/30;G06F17/14
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 顾炜
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 联合 字典 学习 稀疏 表示 通道 语音 增强 方法
【说明书】:

发明提供一种基于联合字典学习和稀疏表示的单通道语音增强方法,对干净语音做双树复数小波变换得到一组子带信号,对子带信号做短时傅里叶变换得到其时频谱,利用其幅度、实部和虚部以及语音稀疏性学习出干净语音的联合字典,同样学习出干净噪声的联合字典;对带噪语音做双树复数小波变换和短时傅里叶变换,获得每个子带信号时频谱,保留相位和实部虚部符号,提取幅度、实部和虚部绝对值并分别在干净语音和干净噪声联合字典上投影,得到语音和噪声的稀疏表示系数,利用该系数、时频谱相位和实部虚部符号以及掩码、权值等,得到该子带语音时频谱的最终估计,做短时傅里叶逆变换和双树复数小波逆变换,得到增强后的语音信号,提高了语音增强能力。

技术领域

本发明涉及单通道语音增强领域,尤其涉及一种基于联合字典学习和稀疏表示的单通道语音增强方法。

背景技术

在人们的交流活动中,语音发挥着主导作用。由于受到形形色色噪声的污染,人耳和相关智能装置收到的是带噪语音,语音的质量和可懂度会有明显的下降,影响了人们的主观听觉感受和智能装置的语音识别率。语音增强技术就是解决这类问题的主要方法。如何从带噪语音中恢复出干净语音一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征并构造相应的字典,将带噪语音在字典上投影,进而估计出干净语音。但大多数算法只利用了语音时频谱的幅度信息,很少利用相位信息,因而语音增强的性能也就受到了限制。

发明内容

本发明的目的是提供一种基于联合字典学习和稀疏表示的单通道语音增强方法,将双树复数小波变换应用于干净语音信号得到一组子带信号,对每个子带信号进行短时傅里叶变换得到其时频谱,充分利用时频谱幅度、实部和虚部以及语音的稀疏性学习训练语音样本的结构特征,构造出干净语音的联合字典,采用同样思路构造出干净噪声的联合字典;针对带噪语音信号,同样采用双树复数小波变换和短时傅里叶变换,获得每个子带信号时频谱,保留相位和实部虚部符号,提取幅度、实部和虚部绝对值并分别在干净语音联合字典和干净噪声联合字典上进行投影,得到语音和噪声的稀疏表示系数,利用稀疏表示系数、保留的时频谱相位和实部虚部符号以及掩码、权值等进行一系列运算,得到该子带语音时频谱的最终估计,然后进行短时傅里叶逆变换和双树复数小波逆变换,得到增强后的语音信号,提高了语音增强能力。

本发明的目的是通过以下技术方案实现的:一种基于联合字典学习和稀疏表示的单通道语音增强方法,包括:

训练阶段,构建干净语音和干净噪声的训练数据集;针对干净语音训练数据集,用双树复数小波变换(DTCWT)将语音信号分解为一组子带信号,对每个子带信号进行短时傅里叶变换(STFT),获得时频谱,提取相应的幅度、实部和虚部绝对值,采用LARC算法和K-SVD算法学习训练数据样本的结构特征,获得干净语音每个子带的幅度、实部和虚部的联合字典;针对干净噪声训练数据集,采用同样思路获得干净噪声每个子带的幅度、实部和虚部的联合字典;

检测阶段,针对带噪语音信号,用双树复数小波变换(DTCWT)将语音信号分解为一组子带信号,对每个子带信号进行短时傅里叶变换(STFT),获得时频谱,提取相应的幅度、实部和虚部绝对值,保留相位信息以及实部、虚部符号,并分别在干净语音联合字典和干净噪声联合字典上进行投影,得到语音和噪声的稀疏表示系数,利用稀疏表示系数、保留的时频谱相位和实部虚部符号以及掩码等进行一系列运算,得到该子带语音时频谱的初始估计和更新估计,进一步通过加权得到最终估计,然后进行短时傅里叶逆变换(ISTFT)和双树复数小波逆变换(IDTCWT),得到增强后的语音信号。

本发明与现有技术相比的优点在于:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010454159.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top