[发明专利]语音合成方法、装置和电子设备在审
| 申请号: | 202110632585.9 | 申请日: | 2021-06-07 |
| 公开(公告)号: | CN113327577A | 公开(公告)日: | 2021-08-31 |
| 发明(设计)人: | 赵情恩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L25/27 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 合成 方法 装置 电子设备 | ||
本公开提供了一种语音合成方法、装置和电子设备,涉及语音、人工智能技术领域,尤其涉及语音合成、自然语言处理、深度学习技术领域。具体实现方案为:获取目标用户的模型参数;将第一目标语音合成模型的待更新模型参数更新为目标用户的模型参数,生成第二目标语音合成模型;将待合成文本输入至第二目标语音合成模型,其中,第二目标语音合成模型用于合成目标语音,目标语音具有所述目标用户的语音特征。由此,只需利用目标用户的模型参数对模型进行更新,大大减少了模型训练次数和语音合成的运算量,节省语音合成的成本。
技术领域
本公开涉及计算机技术领域,尤其涉及一种语音合成方法、语音合成模型的训练方法、装置、电子设备、存储介质和计算机程序产品。
背景技术
目前,语音合成方法可将文本转换为具有目标用户语音特征的音频,在语音聊天、智能家居等领域得到了广泛应用。然而相关技术中的语音合成方法需要根据目标用户的语音片段进行模型的训练和更新,之后根据更新后的模型进行语音合成,模型训练次数较多,且模型训练所需的运算量较大,语音合成的成本也较大。
发明内容
本公开提供了一种语音合成方法、语音合成模型的训练方法、装置、电子设备、存储介质和计算机程序产品。
根据第一方面,提供了一种语音合成方法,包括:获取目标用户的模型参数;将第一目标语音合成模型的待更新模型参数更新为所述目标用户的模型参数,生成第二目标语音合成模型;获取待合成文本,并将所述待合成文本输入至所述第二目标语音合成模型,其中,所述第二目标语音合成模型用于合成目标语音,所述目标语音具有所述目标用户的语音特征。
根据第二方面,提供了一种语音合成模型的训练方法,包括:获取样本用户的样本语音和所述样本语音对应的标注文本;根据所述样本语音和所述标注文本对初始语音合成模型进行训练,生成候选语音合成模型;为所述候选语音合成模型配置待更新的模型参数;根据所述样本语音和所述标注文本对配置有所述待更新的模型参数的所述候选语音合成模型进行训练,生成第一目标语音合成模型。
根据第三方面,提供了一种语音合成装置,包括:第一获取模块,用于获取目标用户的模型参数;更新模块,用于将第一目标语音合成模型的待更新模型参数更新为所述目标用户的模型参数,生成第二目标语音合成模型;合成模块,用于获取待合成文本,并将所述待合成文本输入至所述第二目标语音合成模型,其中,所述第二目标语音合成模型用于合成目标语音,所述目标语音具有所述目标用户的语音特征。
根据第四方面,提供了一种语音合成模型的训练装置,包括:第二获取模块,用于获取样本用户的样本语音和所述样本语音对应的标注文本;第一训练模块,用于根据所述样本语音和所述标注文本对初始语音合成模型进行训练,生成候选语音合成模型;配置模块,用于为所述候选语音合成模型配置待更新的模型参数;第二训练模块,用于根据所述样本语音和所述标注文本对配置有所述待更新的模型参数的所述候选语音合成模型进行训练,生成第一目标语音合成模型。
根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面所述的语音合成方法,或者执行本公开第二方面所述的语音合成模型的训练方法。
根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开第一方面所述的语音合成方法,或者执行本公开第二方面所述的语音合成模型的训练方法。
根据第七方面,提供了一种计算机程序产品,包括计算机程序,其中,所述计算机程序被处理器执行时实现本公开第一方面所述的语音合成方法,或者执行本公开第二方面所述的语音合成模型的训练方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110632585.9/2.html,转载请声明来源钻瓜专利网。





