[发明专利]一种语音信号频域盲解卷积方法无效

申请号：	201210227840.2	申请日：	2012-07-03
公开（公告）号：	CN102760435A	公开（公告）日：	2012-10-31
发明（设计）人：	丁志中;黄玉雷;戴礼荣;陈小平	申请（专利权）人：	合肥工业大学
主分类号：	G10L15/18	分类号：	G10L15/18
代理公司：	安徽合肥华信知识产权代理有限公司 34112	代理人：	余成俊
地址：	230009 ***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音信号频域盲解卷积方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于多媒体信息处理中语音信号提取与识别领域，具体涉及一种语音信号频域盲解卷积方法，可应用于人机交互场景中提高交互识别率。

背景技术

自动语音识别技术经过60余年的发展，在无噪声或无干扰环境下，识别率已经超过95%。但是在实际应用环境中尤其是两个或多个说话人同时说话时，语音识别率骤然下降，这极大的限制了该技术在人机交互(Human-Machine Interaction, HMI)中的应用。人类的听觉系统能在嘈杂的环境中获取自己感兴趣的信息，而处于人机交互环境下的机器人很难拥有此能力。盲信号分离就是在原始信号和传输通道均未知的情况下仅由接收传感器得到的混合信号来估计原始信号的一种技术。

HMI环境下的盲分离属于盲解卷范畴，对于卷积混合信号或者真实环境下混合语音信号，学术界主要有两种方法对其进行解卷积，一种是时域盲解卷，另一种是频域盲解卷。时域盲解卷主要是基于ICA概念将线性瞬时混合情况下的标量混合矩阵扩展为卷积混合情况下的滤波器混合矩阵，并对目标函数和迭代算法做一定的修正。频域盲解卷算法的基本思想是利用短时傅里叶变换将时域卷积混合信号变换为频域瞬时混合信号，再利用较为成熟的瞬时混合盲分离算法对频域混合信号进行分离，即在频域里每一个频点利用瞬时混合的盲分离算法进行分离，解决输出信号的次序不确定以及信号幅度不确定之后再通过逆傅里叶变换得到分离后的时域信号。

时域盲解卷的劣势在于计算量太大，尤其是当混合滤波器较为复杂时，求解滤波器的每一阶都要依靠其余阶的求解。例如Chan提出的对角常数化分离矩阵算法，混合滤波器为5阶以下时，算法能快速的分离混合信号，而当滤波器的阶数为6阶以上时，分离速度明显下降且分离效果变差。而频域算法在每个频率点分离相互独立，混合滤波器阶数对计算量影响较时域算法小很多。

国内外现有盲解卷积方法并不多，现有方法在以下方面存在不足：

1）大多数算法是在一定限定条件下得到的，分离效果不理想，分离后信号交叉干扰较大，稳健性不高。

2）在真实环境人机交互过程中，识别正确率不高。

3）现有算法搜索速度慢，实时性较差，并不能很好的应用于实时人机交互场景。

发明内容

本发明针对上述现有技术所存在的不足，公开了一种语音信号频域盲解卷积方法，该方法通过将时域卷积混合信号变换到频域进行盲分离，分离效果较好，可应用于语音识别领域。

本发明解决技术问题采用如下技术方案：

语音信号频域盲解卷积方法，其特征在于：将时域卷积混合的语音信号变换到频域进行盲分离，具体包括以下步骤：

1）对原始音频文件的自适应分帧，当采样频率为16KHz时，帧长取16ms，帧移取2ms；

2）对单帧数据进行傅里叶变换，将卷积混合信号模型转变为线性混合模型；卷积混合模型可以表示为

x(t)=H⊗s(t) ]]> （表示卷积）（1）

信号的短时傅里叶变换可以表示为