[发明专利]一种声音模仿方法及装置有效
| 申请号: | 201310423715.3 | 申请日: | 2013-09-17 |
| 公开(公告)号: | CN103489443A | 公开(公告)日: | 2014-01-01 |
| 发明(设计)人: | 赵欢;郑睿;陈佐;张希翔;杨泽英 | 申请(专利权)人: | 湖南大学 |
| 主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L19/04 |
| 代理公司: | 湖南兆弘专利事务所 43008 | 代理人: | 赵洪;谭武艺 |
| 地址: | 410082*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 声音 模仿 方法 装置 | ||
技术领域
本发明涉及语音信号处理领域,具体涉及一种声音模仿方法及装置。
背景技术
在语音信号处理技术的快速发展和社交平台的流行推广下,声音模仿的相关研究凸显其应用优势并逐步占据重要位置。现有技术常见的声音模仿方法均为针对声道模型进行变化,其声音模仿的效果不甚理想,存在声音模拟相似度偏低的缺点。
公开号为CN102592590A的中国发明专利申请公开的技术方案记载了一种可任意调节的语音自然变声方法及装置提出将语音信号在声道中进行建模,随后求出发音的系统模型,即声道的模型,之后再改变声道的模型,最后在新的声道模型中还原出语音信号。在一定程度了实现了声音的音色变化,但并没有从本质上达到声音模拟的效果;公开号为CN101567132A的中国发明专利申请公开的技术方案记载了一种变声装置提出采用读报发声装置的音频调节装置和音量调节装置,使音频调节装置和音量调节装置可以对读报发声装置进行音频和音量的自由调节,该装置在音调和音量上实现了声音的变化,但对声音模仿中主要的音色没有变化,实现的声音模拟效果不甚理想。而且,目前声音模仿系统普遍采用的是预存好音料的音料库。虽然预存好的音料库可以简化采集音料的步骤,但这种方式大大局限了声音模仿对象的可选择性,缺少机动性和灵活性,并降低了基于声音模仿方面的应用的趣味性。综上所述,当前声音模仿方法普遍存在声音模拟效果不甚理想、声音模拟相似度偏低、音料库数据单一、无法增长、不可变化等问题。
发明内容
针对现有技术的上述问题,本发明要解决的技术问题是提供一种声音模拟效果好、声音模仿相似度较高、能够实现音料库自动扩展的声音模仿方法及装置。
为了解决上述技术问题,本发明采用的技术方案为:
一种声音模仿方法,其实施步骤如下:
1)获取说话人的语音信号及在音料库中指定的模仿对象,将所述语音信号进行分帧加窗预处理,从所述预处理后的语音信号中选择一个语音帧作为当前语音帧,跳转执行下一步;
2)将当前语音帧根据音料库中指定的模仿对象进行音调转换及音色转换;
3)将音调转换及音色转换后的结果重新合成得到合成语音帧;
4)将所述合成语音帧添加至模仿语音帧;
5)判断所述语音信号的所有语音帧是否已经全部处理完毕,如果尚未处理完毕则选择一个尚未处理的语音帧作为当前语音帧并跳转执行步骤2),否则跳转执行下一步;
6)将由所述模仿语音帧构成的模仿语音输出。
作为本发明声音模仿方法的进一步改进:
所述步骤2)中将当前语音帧根据音料库中指定的模仿对象进行音调转换的详细步骤如下:
2.1.1)将当前语音帧进行线性预测分析;
2.1.2)根据线性预测分析得到的结果获取当前语音帧的LPC残差信号;
2.1.3)对所述LPC残差信号进行离散傅立叶变换并计算幅度谱;
2.1.4)将离散傅立叶变换后的LPC残差信号和以及所述幅度谱通过伪谐波语音模型构建得到伪谐波语音;
2.1.5)提取所述音料库中指定的模仿对象的基音周期;
2.1.6)根据所述模仿对象的基音周期对伪谐波语音进行基音变换;
2.1.7)将基音变换后的伪谐波语音进行离散傅立叶逆变换得到的合成残差新信号作为音调转换的结果输出。
所述步骤2)中将当前语音帧根据音料库中指定的模仿对象进行音色转换的详细步骤如下:
2.2.1)将当前语音帧进行线性预测分析;
2.2.2)根据线性预测分析得到的结果获取当前语音帧的声道滤波器;
2.2.3)提取所述音料库中指定的模仿对象的声道滤波器;
2.2.4)将所述模仿对象的声道滤波器替换当前语音帧的声道滤波器作为音色转换的结果。
所述步骤1)中将所述语音信号进行分帧加窗预处理之后还包括将语音信号作为模仿对象存入音料库的步骤,所述将语音信号作为模仿对象存入音料库的详细步骤如下:
1.1)将当前语音帧进行线性预测分析;
1.2)根据线性预测分析得到的结果获取当前语音帧的LPC残差信号以及声道滤波器;
1.3)将所述LPC残差信号通过循环幅度平方和函数进行处理;
1.4)将通过循环幅度平方和函数处理后的LPC残差信号提取说话人的基音周期;
1.5)将所述说话人的基音周期及声道滤波器作为模仿对象的语音参数存入音料库。
此外,本发明还提供一种声音模仿装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310423715.3/2.html,转载请声明来源钻瓜专利网。





