[发明专利]一种高质量的语音转换方法有效

专利信息
申请号: 201710166971.7 申请日: 2017-03-20
公开(公告)号: CN107103914B 公开(公告)日: 2020-06-16
发明(设计)人: 李燕萍;崔立梅;吕中良 申请(专利权)人: 南京邮电大学
主分类号: G10L25/24 分类号: G10L25/24;G10L25/18;G10L25/27;G10L25/48;G10L15/06;G10L15/14;G10L13/02
代理公司: 江苏海越律师事务所 32402 代理人: 唐小红
地址: 210003 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 质量 语音 转换 方法
【权利要求书】:

1.一种高质量的语音转换方法,包括训练部分和转换部分:

1)、训练部分步骤:

1-1)获取源说话人和目标说话人的平行语料库;

1-2)使用AHOcoder语音分析模型提取语音特征参数和对数基频;

1-3)对步骤1-2)中的语音特征参数进行DTW;

2)、转换部分步骤:

2-1)输入待转换的源说话人语音;

2-2)使用AHOcoder语音分析模型提取特征参数和对数基频;

2-3)使用ISODATA+GMM和训练时得到的参数λ,求取后验条件概率矩阵;

2-4)将频率弯折因子α(x,λ)和幅度调节因子s(x,λ)代入双线性频率弯折和幅度调节转换函数,求得转换后的特征参数,其中的x指语音的频谱特征参数,λ指GMM模型参数;

2-5)将对数基频代入训练时得到的基频转换函数得到转换后的对数基频;

2-6)使用AHOdecoder语音合成模型将转换后的特征参数和对数基频合成转换后的语音;

其特征在于,所述训练部分步骤中,还包括:

1-4)使用迭代自组织算法ISODATA对步骤1-3)中的特征参数进行GMM训练的初始值设定,并用EM算法进行GMM训练,得到GMM参数λ和后验条件概率矩阵P(X|λ),其中的X指语音的频谱特征参数集;

1-5)使用步骤1-4)中的后验条件概率矩阵P(X|λ)进行BLFW+AS训练,得到频率弯折因子α(x,λ)和幅度调节因子s(x,λ),从而构建BLFW+AS转换函数;使用对数基频的均值和方差建立源语音基音频率和目标语音基音频率之间的转换函数。

2.根据权利要求1所述的一种高质量语音转换方法,其特征在于,训练部分步骤1-4)中参数λ是根据说话人语音特征参数的具体分布来决定的。

3.根据权利要求1所述的一种高质量语音转换方法,其特征在于,训练部分步骤1-5)中频率弯折因子和幅度调节因子是根据ISODATA+GMM训练得到的后验条件概率矩阵来训练得到的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710166971.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top