[发明专利]一种语音信号增强的方法和装置有效
申请号: | 200910236917.0 | 申请日: | 2009-10-27 |
公开(公告)号: | CN102054482A | 公开(公告)日: | 2011-05-11 |
发明(设计)人: | 刘霖;田康 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 北京鑫媛睿博知识产权代理有限公司 11297 | 代理人: | 龚家骅 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 信号 增强 方法 装置 | ||
技术领域
本发明涉及通信技术领域,特别涉及一种语音信号增强的方法和装置。
背景技术
随着3G(3rd Generation,第三代移动通信系统)的发展,可视电话业务得到了广泛的应用。可视电话业务在实现基本通信的同时,可以让通话双方观察到对方所处的通话场景,增强了用户的使用感受。在可视电话通话过程中,为了让摄像头捕捉到通话双方的实时通话场景图像,通话双方在通话时需要与手机话筒保持一定的距离,因此,手机话筒采集到的通话语音信号中混入了大量的噪声,噪声的引入降低了通话信号的信噪比,影响了可视电话的通话质量。
在现有技术中,为了降低噪声对通话质量的干扰,将带噪语音信号经傅里叶变换变换到频域,在频域对带噪语音信号进行谱相减算法,从带噪语音的幅度谱中减去噪声的幅度谱,得到纯净语音的幅度谱,其原理如下所示:
带噪语音模型为:
y(n)=s(n)+d(n) 式(1)
其中,y(n)代表带噪语音,s(n)代表纯净语音,d(n)代表混入的噪声。
对式(1)两边作傅里叶变换,可得:
Y(k)=S(k)+D(k) 式(2)
其中,Y(k)代表带噪语音的傅里叶系数,S(k)代表纯净语音的傅里叶系数,D(k)代表噪声的傅里叶系数。
忽略带噪语音和纯净语音之间的相位差异,可得:
|Y(k)|=|S(k)|+|D(k)| 式(3)
利用人耳对于相位信息的不敏感性,可以直接从带噪语音的幅度谱中减去噪声的幅度谱,得到纯净语音的幅度谱,并作为得到的增强语音的幅度谱。由此得到基本的表达式为:
式(4)
而在实际使用过程中,更多使用的是谱相减的改进形式,式(5)为谱相减的改进形式:
这种改进形式的谱相减算法与普通谱相减算法的差别在于引入了α和β两个参数,参数的引入给谱相减算法提供了很大的灵活性。对带噪语音进行谱相减的系统原理,如图1所示。
然而,现有技术中利用谱相减算法消减噪声的过程存在如下技术缺陷:对带噪语音进行频谱相减时,无法准确的判断噪声频谱和语音频谱,因此频谱相减算法在消减噪声的同时,也使得语音频谱受到了较大的消减,影响了人类听觉对正常语音频谱的感知能力。
因此,基于现有技术中利用谱相减算法进行语音增强的过程中出现的对语音信号的削减,对现有的谱相减算法做了很多改进,通过调整频谱相减中消减噪声的强度,优化语音增强的性能。
方案1,根据带噪语音的频谱概率特性以及噪声频谱的概率特性,进行平均计算,用以控制消减噪声幅度的强度;
方案2,将传统谱相减算法中α=1,β=2,改为α=2,β=5,得到改进的谱相减法,利用训练得到的系数,控制噪声消减的强度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910236917.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:座椅倾斜装置
- 下一篇:耐剥离性和耐磨性优异的金刚石包覆工具