[发明专利]一种基于频谱包络和基音周期的男女语音转换方法在审
申请号: | 201711455053.2 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108417198A | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 陈明义;杨婧 | 申请(专利权)人: | 中南大学 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L25/30;G10L25/18;G10L25/03 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基音周期 频谱包络 语音转换 个性化语音 男性 语音 预处理 模型输出参数 参数输入 合成目标 合成问题 男女性别 匹配模型 语音合成 语音训练 转换模型 女性 合成 说话 | ||
1.一种基于频谱包络和基音周期的男女语音转换方法,其特征在于,所述方法是利用神经网络得到男性和女性频谱包络和基音周期的转换模型,在说话内容相同的前提下,实现性别之间的语音转换,转换方法的好坏直接反映在用户对转换后音频的听觉感受以及可视化的声纹中。
2.根据权利要求1所述的方法,其特征在于,包括:
S1:男女语音训练阶段,先对男性和女性语音进行预处理,然后提取其频谱包络参数和基音周期,建立转换模型;
S2:男女语音转换阶段,将男性/女性语音的频谱包络参数和基音周期输入转换模型中,将模型输出参数进行语音合成,合成目标性别语音。
3.根据权利要求2所述的方法,其特征在于,所述步骤S1中,所述的预处理是指设置一系列参数,对语音进行分帧加窗预处理。所述的频谱包络参数提取中进行LSP(linearspectrum pair)分析,求出LSP系数。所述的韵律特征提取中,本发明循环平均幅度差函数法获取基音周期T。
4.根据权利要求2所述的方法,其特征在于,所述步骤S1中,所述建立转换模型中,分别通过BP(Back Propagation)神经网络和GRNN(General Regression Neural Network)神经网络找出频谱包络LSP参数和基音周期T的非线性转换关系。
5.根据权利要求2所述的方法,其特征在于,所述步骤S2中,进一步包括:
S21:获得男性/女性语音的频谱包络LSP参数和基音周期T;
S22:将男性/女性语音的频谱包络LSP参数和基音周期T输入到转换模型中,得到转换后的目标性别语音的频谱包络LSP参数和基音周期T;
S23:将目标性别语音的频谱包络LSP参数和基音周期T进行语音合成,最后输出并画出语音声纹图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711455053.2/1.html,转载请声明来源钻瓜专利网。