[发明专利]语音合成方法、装置、可读介质及电子设备有效

申请号：	202011315115.1	申请日：	2020-11-20
公开（公告）号：	CN112489621B	公开（公告）日：	2022-07-12
发明（设计）人：	潘俊杰	申请（专利权）人：	北京有竹居网络技术有限公司
主分类号：	G10L13/08	分类号：	G10L13/08;G10L13/02;G10L13/027
代理公司：	北京英创嘉友知识产权代理事务所(普通合伙) 11447	代理人：	张岩龙
地址：	101299 北京市平***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成方法装置可读介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开涉及一种语音合成方法、装置、可读介质及电子设备，涉及电子信息处理技术领域，该方法包括：获取待合成文本和指定情感类型，确定指定情感类型对应的指定声学特征，将待合成文本和指定声学特征输入预先训练的语音合成模型，以获取语音合成模型输出的，待合成文本对应的具有指定情感类型的目标音频，目标音频的声学特征与指定声学特征匹配，语音合成模型为根据不具有指定情感类型的语料训练得到的。本公开能够通过情感类型对应的声学特征来控制对文本的语音合成，使得语音合成模型输出的目标音频能够与声学特征对应，提高了目标音频的表现力。

技术领域

本公开涉及电子信息处理技术领域，具体地，涉及一种语音合成方法、装置、可读介质及电子设备。

背景技术

随着电子信息处理技术的不断发展，语音作为人们获取信息的重要载体，已经被广泛应用于日常生活和工作中。涉及语音的应用场景中，通常会包括语音合成的处理，语音合成是指将用户指定的文本，合成为音频。语音合成过程中，需要借助原始音库来生成文本对应的音频。原始音库中的数据通常是不具有情感的，相应的，语音合成处理得到的音频也不具有情感，音频的表现力较弱。要使语音合成得到的音频具有情感，就需要创建具有情感的音库，对于录音人员来说工作量大、效率低，很难实现。

发明内容

提供该发明内容部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

第一方面，本公开提供一种语音合成方法，所述方法包括：

获取待合成文本和指定情感类型；

确定所述指定情感类型对应的指定声学特征；

将所述待合成文本和所述指定声学特征输入预先训练的语音合成模型，以获取所述语音合成模型输出的，所述待合成文本对应的具有所述指定情感类型的目标音频，所述目标音频的声学特征与所述指定声学特征匹配，所述语音合成模型为根据不具有所述指定情感类型的语料训练得到的。

第二方面，本公开提供一种语音合成装置，所述装置包括：

获取模块，用于获取待合成文本和指定情感类型；

确定模块，用于确定所述指定情感类型对应的指定声学特征；

合成模块，用于将所述待合成文本和所述指定声学特征输入预先训练的语音合成模型，以获取所述语音合成模型输出的，所述待合成文本对应的具有所述指定情感类型的目标音频，所述目标音频的声学特征与所述指定声学特征匹配，所述语音合成模型为根据不具有所述指定情感类型的语料训练得到的。

第三方面，本公开提供一种计算机可读介质，其上存储有计算机程序，该程序被处理装置执行时实现本公开第一方面所述方法的步骤。

第四方面，本公开提供一种电子设备，包括：

存储装置，其上存储有计算机程序；

处理装置，用于执行所述存储装置中的所述计算机程序，以实现本公开第一方面所述方法的步骤。

通过上述技术方案，本公开首先获取待合成文本和指定情感类型，之后根据指定情感类型，确定对应的指定声学特征，最后将待合成文本和指定声学特征一起输入到预先训练好的语音合成模型中，语音合成模型输出的即为待合成文本对应的，具有指定情感类型的目标音频，其中，目标音频的声学特征与指定声学特征匹配，并且语音合成模型为根据不具有指定情感类型的语料训练得到的。本公开能够通过情感类型对应的声学特征来控制对文本的语音合成，使得语音合成模型输出的目标音频能够与声学特征对应，提高了目标音频的表现力。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司，未经北京有竹居网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011315115.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种非磁性薄板分张机器人夹具及分张方法
下一篇：一种提高高频电源抗扰动能力的方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音合成方法、装置、可读介质及电子设备有效

专利文献下载