[发明专利]一种语音信号增强的方法和装置有效

申请号：	200910236917.0	申请日：	2009-10-27
公开（公告）号：	CN102054482A	公开（公告）日：	2011-05-11
发明（设计）人：	刘霖;田康	申请（专利权）人：	中国移动通信集团公司
主分类号：	G10L21/02	分类号：	G10L21/02
代理公司：	北京鑫媛睿博知识产权代理有限公司 11297	代理人：	龚家骅
地址：	100032 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音信号增强方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及通信技术领域，特别涉及一种语音信号增强的方法和装置。

背景技术

随着3G(3rd Generation，第三代移动通信系统)的发展，可视电话业务得到了广泛的应用。可视电话业务在实现基本通信的同时，可以让通话双方观察到对方所处的通话场景，增强了用户的使用感受。在可视电话通话过程中，为了让摄像头捕捉到通话双方的实时通话场景图像，通话双方在通话时需要与手机话筒保持一定的距离，因此，手机话筒采集到的通话语音信号中混入了大量的噪声，噪声的引入降低了通话信号的信噪比，影响了可视电话的通话质量。

在现有技术中，为了降低噪声对通话质量的干扰，将带噪语音信号经傅里叶变换变换到频域，在频域对带噪语音信号进行谱相减算法，从带噪语音的幅度谱中减去噪声的幅度谱，得到纯净语音的幅度谱，其原理如下所示：

带噪语音模型为：

y(n)＝s(n)+d(n) 式(1)

其中，y(n)代表带噪语音，s(n)代表纯净语音，d(n)代表混入的噪声。

对式(1)两边作傅里叶变换，可得：

Y(k)＝S(k)+D(k) 式(2)

其中，Y(k)代表带噪语音的傅里叶系数，S(k)代表纯净语音的傅里叶系数，D(k)代表噪声的傅里叶系数。

忽略带噪语音和纯净语音之间的相位差异，可得：

|Y(k)|＝|S(k)|+|D(k)| 式(3)

利用人耳对于相位信息的不敏感性，可以直接从带噪语音的幅度谱中减去噪声的幅度谱，得到纯净语音的幅度谱，并作为得到的增强语音的幅度谱。由此得到基本的表达式为：

式(4)

而在实际使用过程中，更多使用的是谱相减的改进形式，式(5)为谱相减的改进形式：