[发明专利]语音合成方法、相关设备及可读存储介质在审
| 申请号: | 201911393613.5 | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111128118A | 公开(公告)日: | 2020-05-08 |
| 发明(设计)人: | 周良;王志鹍;江源;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L25/30;G10L25/63 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王小清 |
| 地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 合成 方法 相关 设备 可读 存储 介质 | ||
本申请公开了一种语音合成方法、相关设备及可读存储介质,获取待进行语音合成的文本后,确定该文本对应的情感编码,利用该文本对应的情感编码,得到该文本的语音合成参数,对该文本的语音合成参数进行语音合成处理,得到该文本对应的语音。上述方案中,由于该文本对应的情感编码能够指示该文本进行语音合成时的情感强度,而用户可以根据自身对语音合成的情感强度需求控制该文本对应的情感编码,使得利用该文本对应的情感编码得到的该文本对应的语音,是满足用户对语音合成时的情感强度需求的语音。
技术领域
本申请涉及语音合成技术领域,更具体的说,是涉及一种语音合成方法、相关设备及可读存储介质。
背景技术
随着语音合成技术的发展,语音合成的评价标准不仅仅是自然度等评分,对合成音频的情感表现力的要求越来越高。但是,现有的语音合成方法一般机械地直接将文本合成语音,或者只能合成单一的语音,无法对合成语音的情感强度进行控制。
因此,需要一种能够对合成语音的情感强度进行控制的语音合成方法。
发明内容
鉴于上述问题,本申请提供了一种语音合成方法、相关设备及可读存储介质。具体方案如下:
一种语音合成方法,包括:
获取待进行语音合成的文本;
确定所述文本对应的情感编码,所述情感编码用于指示语音合成的情感强度;
基于所述情感编码,确定所述文本的语音合成参数;
对所述文本的语音合成参数进行语音合成处理,得到所述文本对应的语音。
可选地,所述确定所述文本对应的情感编码,包括:
将所述文本输入文本情感编码识别模型,得到所述文本对应的情感编码,所述文本情感编码识别模型为利用标注有情感编码的情感识别训练文本预训练得到。
可选地,确定所述文本对应的情感编码,包括:
获取所述文本对应的预设定的初始情感编码;
基于所述初始情感编码,确定所述文本对应的情感编码。
可选地,所述基于所述初始情感编码,确定所述文本对应的情感编码,包括:
将所述初始情感编码作为所述文本对应的情感编码;
或,
获取情感强度信息,所述情感强度信息用于指示用户对待合成语音的情感强度需求;
基于所述情感强度信息,利用插值方法对所述初始情感编码进行调整,调整后的情感编码作为所述文本对应的情感编码。
可选地,所述获取所述文本对应的预设定的初始情感编码,包括:
获取所述文本对应的情感标签;
基于预设定的情感标签与情感编码的对应关系,确定与所述情感标签对应的情感编码,作为所述文本对应的初始情感编码。
可选地,所述基于所述情感编码,确定所述文本的语音合成参数,包括:
获取所述文本的文本单元序列;
将所述情感编码和所述文本单元序列输入融合模型,得到融合模型输出的所述文本的语音合成参数,其中,融合模型以训练语音的情感编码,和训练语音对应文本的文本单元序列为训练样本,以训练语音对应文本的标注语音合成参数为样本标签训练得到。
可选地,所述将所述情感编码和所述文本单元序列输入融合模型,得到融合模型输出的所述文本的语音合成参数,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911393613.5/2.html,转载请声明来源钻瓜专利网。





