[发明专利]一种使用盲语音分离的语音转换系统和方法无效

申请号：	201210090640.7	申请日：	2012-03-30
公开（公告）号：	CN102592607A	公开（公告）日：	2012-07-18
发明（设计）人：	申艳;汶跃龙;张嘉驰;范礼乾;杨柳;蒋诗慧	申请（专利权）人：	北京交通大学
主分类号：	G10L21/02	分类号：	G10L21/02;G10L15/14;G10L11/06;G10L19/04
代理公司：	北京正理专利代理有限公司 11257	代理人：	张雪梅
地址：	100044***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种使用语音分离转换系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音转换、分析以及信号处理，具体涉及一种使用盲语音分离的语音转换系统和方法。

背景技术

语音转换是要改变一个说话人的语音，使之听起来象是另外一个人的语音，即实现特定的源说话人到目标说话人之间音色特征的转换。语音转换系统要进行两次语音输入，第一次需要采集一定量的源说话人语音和目标说话人语音建立两个平行语音库，然后通过对源和目标语音库中的语音进行特征参数提取及训练，建立源到目标的转换函数；第二次需要输入任意内容的源说话人语音到转换函数中，转换系统即可输出相同内容的目标说话人语音。语音转换是语音信号处理领域的一个较新的分支，具有很重要的理论价值和实用价值。语音转换的研究对语音分析、语音编码、语音合成、语音增强、语音识别、说话人识别等语音信号处理的其它各个领域有重要的促进作用。

目前常用的语音转换方法是语音特征参数转换，这种方法需要精确提取源说话人和目标说话人语音的特征参数，因此对语音转换器输入的语音的清晰度和信噪比都有较高的要求。

现在的语音转换系统输入的语音一般是在低噪声条件下或将声源与环境隔离得到的高质量语音。但在现实生活中，很多地方都存在背景噪声，包括普通环境产生的多种噪音信号、其他人的背景谈话产生的信号以及从这些信号中的每一种信号中产生的回声、反射和混响。这就极大的限制了语音转换器的对各种环境的适应性和实用性。

现有技术噪音滤波器将具有预定特征的信号识别为白噪声信号。然后从输入信号中减去这些信号。虽然这些方法对实时语音去噪是足够简单和快速的，但却不容易适应不同的声音环境，并且会导致待分辨语音信号的明显恶化。噪音特征的预定假设可能涵盖过广，也可能涵盖不足。结果这些方法可能会将个人语音的某些部分视为“噪音”并因此将其从输入语音信号中除去。同时，这些方法可能会将背景噪音的某些部分，例如音乐或谈话，视为非噪音，并因此将其包含在输出语音信号中。

语音转换系统的输入模块对于在不同的噪声环境下观测所得的语音信号x(t)，是没有任何先验知识的。也就是要在预先并不知道观测信号x(t)各独立源的相关信息的条件下，分离出想要的源信号s(t)(期望语音)，这被称作盲信源分离(BSS)技术。独立分量分析(ICA)是一种用于分离混合源信号的方法，它的目的是将来自多个独立源的混合信号进行分离。ICA的发展与盲信源分离(BSS)是紧密相连的。

对于基于独立分量分析的盲分离技术，1986年JeannyHerauh第一次提出了对盲源分离问题的研究。2004年，ZhijianYuan和ErkkiOja提出了一种用于非负独立分量分析的FastICA。目前，国际国内对盲源分离方法扔处在不断发展的阶段，新的理论和新的方法在源源不断的涌现。到目前为止，对盲源分离的研究主要分为两个类别，分别是多通道盲源分离算法的研究和单通道盲源分离算法的研究。但当前流行的基于ICA的盲信源分离方法，算法复杂度较高，分离过程的运算量较大，不能满足语音转换系统对实时性的要求。

由以可知，想在噪声环境中实现语音转换，需要将想要的源(或目标)说话人的语音从背景噪声之中分离出来。即所需要的是一种在噪音环境下能够实时地实现盲信源分离(BSS)的语音转换系统。

发明内容

为避免以上现有技术的不足，本发明提出一种使用盲语音分离的语音转换系统和方法，以解决在有背景噪声的影响下，提高语音转换的效果。

本发明的目的通过以下技术方案来实现：

一种使用盲语音分离的语音转换系统和方法，该方法包括如下步骤：

1)将采集到的语音信号利用子带分解成低频和高频部分，且分别将低频部分转换得到的语音作为ICA的第一路观测信号x₁(t)，将高频部分转换得到的语音信号作为ICA的第二路观测信号x₂(t)；

2)对所述观测信号进行语音分离；

3)对分离出的语音信号提取语音特征参数，获得的源和目标说话人语音的语音特征参数；

4)对所述语音特征参数输入进行语音转换；

5)对进行语音转换后的语音特征参数进行语音合成得到合成语音。

进一步，所述步骤2)对所述观测信号进行语音分离包括如下步骤：

201)将所述两路信号x₁(t)、x₂(t)构成二维观测信号矩阵X(t)＝[x₁(t)，x₂(t)]^T，作为待分离观测信号；