[发明专利]训练数据匮乏下的鲁棒性语音转换方法有效

专利信息
申请号: 201210488131.X 申请日: 2012-11-27
公开(公告)号: CN102968988A 公开(公告)日: 2013-03-13
发明(设计)人: 徐宁;沈媛;鲍静益 申请(专利权)人: 河海大学常州校区
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L19/13;G10L25/03
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 董建林
地址: 213022 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 训练 数据 匮乏 鲁棒性 语音 转换 方法
【说明书】:

技术领域

发明涉及语音信号处理技术中的语音转换技术,尤其涉及一种训练数据匮乏下的鲁棒性语音转换方法。

背景技术

语音转换是语音信号处理领域中一个比较新的分支,涉及语音分析与合成、语音识别、说话人识别、语音编码和语音增强等各个传统的研究方向。语音转换的最终目标是提供即时的、可以自动快速适应任何说话者的语音服务。然而,目前的语音转换技术还做不到这一点。例如,在Toda,T.,Black,A.W.,and Tokuda,K.:‘Voice Conversion Based on Maximum-Likelihood Estimation of Spectral Parameter Trajectory’,IEEE Trans.on Audio,Speech,and Language Processing,vol.15,no.8,pp.2222-2235,2007发表的文献中就表明:当前的语音转换系统还存在较大的实用性限制,一方面严格限制用户措词造句的模式——用作训练系统的语音数据必须包含相同的语义内容,另一方面还要求确保较大的词汇量——用作训练系统的语音数据量必须是充裕的。

因此,“在实际环境中如何提高系统应对词汇量匮乏问题的鲁棒性”,是该领域迫切需要解决的关键问题。在E.Helander,J.Nurminen,and M.Gabbouj,“LSF mapping for voice conversion with very small training sets,”IEEE Int.Conf.on Acoustics,Speech and Signal Processing,2008,pp.4669-4672文献中,该团队在提出在建模的过程中考虑线谱频率参数之间的耦合关系,并利用这一关系提高系统在数据量稀少情况下的鲁棒性。该算法主要在参数“特征化”的层面展开研究,即通过调整特征参数的结构、提炼参数间蕴含的某种关系等手段来提高系统性能。随后,在文献E.Helander,T.Virtanen,J.Nurminen,and M.Gabbouj,“Voice conversion using partial least squares regression,”IEEE Trans.on Audio Speech and Language Processing,vol.18,no.5,pp.912-921,2010中,他们提出采用部分最小二乘和高斯混合模型相结合的方法来克服训练数据稀少时系统的“过拟合”问题。该改进算法的重点从“特征化”参数转变到了“模型化”系统结构上,即研究设计更可靠的、更符合物理实际的系统模型来揭示数据中隐含的客观本质,从而提高系统抵抗数据量缺乏的能力。

综上所述,虽然近年来一些学者已经针对该问题展开研究,但目前仍然缺乏有组织的系统工作。因此,针对语音转换系统在训练数据量匮乏条件下性能急剧恶化的问题,本发明充分利用模式识别、数据挖掘等领域的最新研究成果,并结合听觉场景分析理论,提出了一种解决方案,以提高语音转换技术在实际环境中的适用性。

发明内容

发明目的:为了克服现有技术中存在的不足,本发明将高斯过程建模和经验模式分解的参数特征化方法应用在语音转换模型中,设计出能充分反映数据统计特性的转换方法;该方法可以描述和刻画局部数据中体现的共性特征,提高转换算法在训练数据匮乏条件下的泛化性;同时,该方法进一步强化特征模式之间的区分度,提高转换算法在训练数据匮乏情况下的精确度。

技术方案:为实现上述目的,本发明采用的技术方案为:

训练数据匮乏下的鲁棒性语音转换方法,利用经验模式分解算法分析平行参数序列,挖掘源与目标个性特征相关的表征信息,并结合高斯过程模型设计并训练转换函数,压缩冗余信息,提高数据匮乏条件下的系统鲁棒性。

所述利用经验模式分解算法分析平行参数序列,具体包括如下步骤:

(a1)利用线性谱频率参数的任一维特征空间在相邻时域上都具有连续变化的特性,利用下述两种方案中的任一方案获得时序序列:

方案一:对于源和目标平行的线性谱频率参数序列,逐次提取他们相应的某一维特征空间的系数,从而构成时序序列X(t);

方案二:对源和目标平行的线性谱频率参数序列,以帧为单位并按时间顺序,分别首尾相连构成扩展的时序序列X(t);

(a2)利用经验模式分解算法对源和目标的时序序列X(t)进行分解,得到若干固态函数ci,i=1,2,…,n和残差信号函数rn,满足

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210488131.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top