[发明专利]基于非负低秩和稀疏矩阵分解原理的语音增强方法有效

申请号：	201310548773.9	申请日：	2013-11-07
公开（公告）号：	CN103559888A	公开（公告）日：	2014-02-05
发明（设计）人：	孙成立;须明;王希敏;谢坚筱	申请（专利权）人：	航空电子系统综合技术重点实验室
主分类号：	G10L21/0232	分类号：	G10L21/0232;G10L21/0272
代理公司：	南昌市平凡知识产权代理事务所 36122	代理人：	欧阳沁
地址：	200233 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于非负低秩稀疏矩阵分解原理语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及信号处理领域，适用于含噪语音的噪声抑制，特别是基于非负低秩和稀疏矩阵分解原理的语音增强方法。

背景技术

语音信号是人类交流信息最自然、最有效的手段。随着人类进入信息化时代，迫切需要使用先进的语音处理技术来促进人类社会智能化。早在2000年，比尔盖茨就曾提出“未来10年是语音的时代”。最近几年，随着苹果、谷歌、微软等公司先后推出智能语音服务，智能语音产业已经成为信息技术领域中的新兴产业，用户认知度和市场规模正在逐渐扩大。特别是苹果新近推出的智能手机具有语音助理功能，以及科大讯飞的语音“云技术”推出，使智能语音技术面临更加广阔的应用。然而，语音通信和应用过程中不可避免地受到来自周围环境、传播媒介和通信设备内部噪声的干扰,严重影响了智能语音技术的实际应用。

语音增强是解决噪声污染的有效技术。语音增强通过抑制噪声对语音的干扰，使得增强处理的语音信号同原始纯净语音信号之间的失真最小。过去几十年来，涌现了许多语音增强算法，典型的算法包括谱减法、基于谱幅度最小均方误差、子空间法、小波降噪法。在信噪比较高的环境下语音增强已经得到了有效解决。然而，由于自然环境中噪声的多样性及语音信号本身的复杂性，语音增强算法根据应用环境的不同而不同，这使得其研究工作难度很大，强噪声和多种噪声环境的语音增强问题仍然没有得到很好解决。

在现有的语音增强算法中，许多方法试图使用语音信号和噪声信号的概率密度模型来最大程度上的移除噪声信号，然而近年研究表明单一的某种分布并不能适用于所有的语音或噪声，需要更为灵活的数学模型和模型估计算法以适应信号自身的特点。此外，在现有语音增强算法中，噪声估计是语音增强算法的前期必备工作。借助噪声估计可以获得噪声功率谱和语音信号的先验信噪比，对语音增强效果的改善至关重要。现有的语音增强方法通过语音端点检测将采集到的语音信号分为噪声段和含噪语音段，利用噪声段来估计和更新噪声估计量，然而这是一种次优估计方式，实际中噪声段和含噪语音段的瞬时噪声并不完全相符，因此，这种噪声估计方法总会带来误差，况且现有语音端点检测技术在低信噪比和非平稳噪声环境下尚不成熟，容易造成误判，会导致语音中存在很大的残留噪声。

近年的压缩感知理论研究表明，许多实际的观测量都可以归结为一个低秩分量和稀疏分量相加的模式，借助矩阵的低秩和稀疏矩阵分解，可以从大噪声或异常值污染数据中恢复原始数据信息。矩阵的低秩和稀疏矩阵分解已经用于图像增强、视频目标检测、数据挖掘等许多科技领域。

平稳随机噪声和周期噪声是最常见的两种噪声类别。平稳随机噪声用一阶和二阶统计量描述其随机过程，它的均值和自相关函数与时间无关，由于随机信号自相关函数的傅里叶变换是功率谱，因此平稳随机噪声的时频矩阵是一个秩数为1的低秩矩阵。同样，如果噪声为周期性噪声，由于其时频矩阵只在某些固定频率处有值，其矩阵列向量具有较强的相关性，必然也是一个低秩矩阵。

综上所述，背景噪声的时频矩阵列向量具有很强的相关性，因此噪声的时频矩阵具有低秩性。相对背景噪声而言，语音源信号在大部分时频点上取值为零或者接近于零，只有少数采样点处取值较大，所以语音源信号具有一定的稀疏性，适合用稀疏矩阵描述。因此，可以考虑借鉴矩阵的低秩和稀疏分解理论来解决语音增强问题。中国专利公开了一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法（公开号：CN102915742A）。该方法首先使用短时傅里叶变换将带噪语音时域波形变换到时频域从而得到带噪语音的幅度谱；利用低秩与稀疏矩阵分解算法将带噪语音的幅度谱分解为噪声幅度谱、语音幅度谱和残余噪声幅度谱三者之和；最后，利用短时傅里叶逆变换从语音的幅度谱中重构出的语音时域波形。该方法的不足在于没有对低秩和稀疏矩阵分解加非负性约束，容易导致从带噪语音幅度谱中分离得到的语音幅度谱含有负值结果。而实际的幅度谱是非负物理量，不应该出现负值现象。负值幅度谱不但引起分解误差，而且会产生人耳感觉难受的音乐噪声，从而影响语音听觉质量。

本发明设计了一种基于非负低秩和稀疏矩阵分解原理的语音增强方法，该方法采用非负低秩和稀疏矩阵分解原理分解含噪语音幅度谱，能使分解获得的语音幅度谱满足非负性，有效提高低秩与稀疏矩阵分解效果。该方法具有鲁棒性强、不需要进行端点检测、以及参数少易调节等优点，适合强噪声环境下的语音增强任务。

发明内容

本发明所要解决的技术问题是提供一种基于非负低秩和稀疏矩阵分解原理的语音增强方法，通过在时频域中引入噪声和语音的低秩和稀疏约束、以及非负性约束来进行低秩和稀疏矩阵分解，实现含噪语音的语噪分离。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于航空电子系统综合技术重点实验室，未经航空电子系统综合技术重点实验室许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310548773.9/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于非负低秩和稀疏矩阵分解原理的语音增强方法有效

专利文献下载