[发明专利]语音合成方法、装置、设备和计算机可读存储介质在审
| 申请号: | 202110130432.4 | 申请日: | 2021-01-29 |
| 公开(公告)号: | CN113053357A | 公开(公告)日: | 2021-06-29 |
| 发明(设计)人: | 张海桐;林悦 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
| 主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/04;G10L13/02 |
| 代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 远明 |
| 地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 合成 方法 装置 设备 计算机 可读 存储 介质 | ||
本申请涉及语音处理领域,提供了语音合成方法、装置、设备和计算机可读存储介质,以较低的成本和较高的效率,将文本转换为可播音的语音。所述方法包括:将目标文本转换为对应的目标音素序列;采用已训练端到端语音合成模型提取目标音素序列的目标声学特征,其中,已训练端到端语音合成模型为采用无标注语音数据对端到端语音合成模型训练得到;将目标声学特征转换成语音波形后输出。本申请的技术方案极大地降低了对有标注语音数据的依赖,采用已训练端到端语音合成模型提取目标音素序列的目标声学特征,将目标声学特征转换成语音波形后输出,成本也一样低廉并且效率高。
技术领域
本发明涉及语音处理领域,特别涉及一种语音合成方法、装置、设备和计算机可读存储介质。
背景技术
近年来,随着深度学习领域的飞速发展,文本转语音(TTS,Text To Speech) 技术也取得了显著的进展。编码器和解码器的端到端TTS模型目前已经能够合成较为自然的语音。然而,这种端到端TTS模型的训练成本却非常高。一般而言,训练这种端到端的TTS模型需要十几或者二十个小时的有标注语音才能达到自然的效果,而录制这些标注的语音既昂贵又繁杂。
为了解决TTS模型的训练对数据的严重依赖,现有的一种语音合成方法是说话人自适应(SA)技术。所谓SA,是指通过用少量的新说话人的数据对多说话人的基础模型进行微调,以达到能够用新说话人声音合成的目的的一项技术。虽然SA技术能够通过少量的新说话人数据快速建模,最后用新说话人声音合成不错的语音,自然度和相似度都达到可用程度。然而,SA技术建立在多说话人的基础模型之上,换言之,若缺乏足够的多说话人的标注数据,则仍然无法使用SA技术。
综上所述,现有的语音合成方法都是基于大量标注数据,尤其是低资源语种的TTS,更加依赖大量标注数据。
发明内容
本申请提供一种语音合成方法、装置、设备和计算机可读存储介质,以较低的成本和较高的效率,将文本转换为可播音的语音。
一方面,本申请提供了一种语音合成方法,包括:
将目标文本转换为对应的目标音素序列;
采用已训练端到端语音合成模型提取所述目标音素序列的目标声学特征,所述已训练端到端语音合成模型为采用无标注语音数据对端到端语音合成模型训练得到;
将所述目标声学特征转换成语音波形后输出。
可选地,所述采用已训练端到端语音合成模型提取所述目标音素序列的目标声学特征,包括:编码所述目标音素序列,将所述目标音素序列映射为所述目标文本的高维文本特征序列;对所述目标文本的高维文本特征序列进行声学解码,预测所述目标音素序列的目标声学特征。
可选地,所述对所述目标文本的高维文本特征序列进行声学解码,预测所述目标音素序列的目标声学特征之前,所述方法还包括:获取语音特征序列;将所述目标文本的高维文本特征序列与所述语音特征序列对齐,得到所述目标文本的对齐高维文本特征序列。
可选地,在将所述目标文本的高维文本特征序列与所述语音特征序列对齐时,加入目标说话人向量来控制目标说话人的音色。
可选地,所述将目标文本转换为对应的目标音素序列,包括:根据所述目标文本的正则特征对所述目标文本进行语音初步处理,提取所述目标文本的辅助性特征;采用所述目标文本的辅助性特征对所述目标文本的正则特征进行前端解码,得到具备语音播放标准的目标音素序列。
可选地,所述根据所述目标文本的正则特征对所述目标文本进行语音初步处理,提取所述目标文本的辅助性特征,包括:将所述目标文本的正则特征输入预先构建的语音初步处理模块中,对所述目标文本进行文字分割和词性标注;所述采用所述目标文本的辅助性特征对所述目标文本的正则特征进行前端解码,得到具备语音播放标准的目标音素序列,包括:将所述目标文本的正则特征和所述目标文本的辅助性特征同时输入预先构建的文本解码模块中,得到具备语音播放标准的目标音素序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110130432.4/2.html,转载请声明来源钻瓜专利网。





