[发明专利]一种高质量的语音转换方法有效
| 申请号: | 201710166971.7 | 申请日: | 2017-03-20 |
| 公开(公告)号: | CN107103914B | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 李燕萍;崔立梅;吕中良 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/18;G10L25/27;G10L25/48;G10L15/06;G10L15/14;G10L13/02 |
| 代理公司: | 江苏海越律师事务所 32402 | 代理人: | 唐小红 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 质量 语音 转换 方法 | ||
1.一种高质量的语音转换方法,包括训练部分和转换部分:
1)、训练部分步骤:
1-1)获取源说话人和目标说话人的平行语料库;
1-2)使用AHOcoder语音分析模型提取语音特征参数和对数基频;
1-3)对步骤1-2)中的语音特征参数进行DTW;
2)、转换部分步骤:
2-1)输入待转换的源说话人语音;
2-2)使用AHOcoder语音分析模型提取特征参数和对数基频;
2-3)使用ISODATA+GMM和训练时得到的参数λ,求取后验条件概率矩阵;
2-4)将频率弯折因子α(x,λ)和幅度调节因子s(x,λ)代入双线性频率弯折和幅度调节转换函数,求得转换后的特征参数,其中的x指语音的频谱特征参数,λ指GMM模型参数;
2-5)将对数基频代入训练时得到的基频转换函数得到转换后的对数基频;
2-6)使用AHOdecoder语音合成模型将转换后的特征参数和对数基频合成转换后的语音;
其特征在于,所述训练部分步骤中,还包括:
1-4)使用迭代自组织算法ISODATA对步骤1-3)中的特征参数进行GMM训练的初始值设定,并用EM算法进行GMM训练,得到GMM参数λ和后验条件概率矩阵P(X|λ),其中的X指语音的频谱特征参数集;
1-5)使用步骤1-4)中的后验条件概率矩阵P(X|λ)进行BLFW+AS训练,得到频率弯折因子α(x,λ)和幅度调节因子s(x,λ),从而构建BLFW+AS转换函数;使用对数基频的均值和方差建立源语音基音频率和目标语音基音频率之间的转换函数。
2.根据权利要求1所述的一种高质量语音转换方法,其特征在于,训练部分步骤1-4)中参数λ是根据说话人语音特征参数的具体分布来决定的。
3.根据权利要求1所述的一种高质量语音转换方法,其特征在于,训练部分步骤1-5)中频率弯折因子和幅度调节因子是根据ISODATA+GMM训练得到的后验条件概率矩阵来训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710166971.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢琴弹奏音准的检测装置
- 下一篇:一种音频数据处理方法以及装置





