[发明专利]语音合成方法、装置和计算机可读存储介质有效
| 申请号: | 202010071427.6 | 申请日: | 2020-01-21 |
| 公开(公告)号: | CN111276120B | 公开(公告)日: | 2022-08-19 |
| 发明(设计)人: | 邓利群;张旸;郑念祖;王雅圣 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G10L13/027 | 分类号: | G10L13/027;G10L13/04 |
| 代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王龙华;王君 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 合成 方法 装置 计算机 可读 存储 介质 | ||
1.一种语音合成的方法,其特征在于,包括:
获取第一用户的待处理数据,所述待处理数据包括所述第一用户的待处理语音或待处理语料中的至少一种;
通过目标模型对所述待处理数据进行处理,获得第一数据,所述第一数据包括利用所述目标模型对所述待处理数据进行解码获得的数据,所述目标模型是基于所述第一用户的个性化训练数据对第一子模型训练后得到的,所述第一用户的个性化训练数据包括所述第一用户的语音和/或语料;
向数据处理设备发送所述第一数据;
接收处理结果,所述处理结果是所述数据处理设备基于第二子模型对所述第一数据进行处理获得的,所述处理结果包括对应于所述第一数据的声学特征,或者所述处理结果包括对应于所述第一数据的音频;其中,所述第一子模型和所述第二子模型由基础声学模型划分得到,所述基础声学模型是基于通用训练数据获得的,所述通用训练数据包括至少一个用户的语音和/或语料。
2.如权利要求1所述的方法,其特征在于,所述个性化训练数据具体包括所述第一用户的待训练数据和目标数据,所述待训练数据包括待训练语料或待训练语音中的至少一种,所述目标数据包括对应于所述待训练数据的目标语音或所述目标语音的声学特征。
3.如权利要求1或2所述的方法,其特征在于,在获取所述第一用户的所述待处理数据之前,所述方法还包括:接收所述目标模型。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述第一数据还包括个性化编码,所述个性化编码包括说话人编码、风格编码、情感编码中的至少一种。
5.一种语音合成的方法,其特征在于,包括:
从终端设备获取第一用户的第一数据,所述第一数据包括所述终端设备通过目标模型对待处理数据进行处理后获得的数据;所述目标模型是基于所述第一用户的个性化训练数据对第一子模型训练后得到的,所述第一用户的个性化训练数据包括所述第一用户的语音和/或语料;
根据第二子模型对所述第一数据进行处理,得到处理结果;
将所述处理结果发送给所述终端设备;其中,所述第一子模型和所述第二子模型由基础声学模型划分得到,所述基础声学模型是基于通用训练数据获得的,所述通用训练数据包括至少一个用户的语音和/或语料。
6.如权利要求5所述的方法,其特征在于,所述个性化训练数据具体包括所述第一用户的待训练数据和目标数据,所述待训练数据包括待训练语料或待训练语音中的至少一种,所述目标数据包括对应于所述待训练数据的目标语音或所述目标语音的声学特征。
7.如权利要求5或6所述的方法,其特征在于,所述方法还包括:将所述目标模型发送给所述终端设备。
8.如权利要求5至7中任一项所述的方法,其特征在于,所述根据所述第二子模型对所述第一数据进行处理,得到处理结果,还包括:
根据所述第二子模型对所述第一数据进行处理,得到对应于所述第一数据的第一声学特征,所述处理结果包括所述第一声学特征。
9.如权利要求5至7中任一项所述的方法,其特征在于,所述根据所述第二子模型对所述第一数据进行处理,得到处理结果,还包括:
根据所述第二子模型对所述第一数据进行处理,得到对应于所述第一数据的第二声学特征;
将所述第二声学特征合成为音频,所述处理结果包括所述音频。
10.如权利要求5至9中任一项所述的方法,其特征在于,所述第一数据还包括个性化编码,所述个性化编码包括说话人编码、风格编码或者情感编码中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010071427.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于关键词的文章生成方法
- 下一篇:一种多通信手段的融合方法





