[发明专利]语音合成方法、系统、设备及存储介质有效
| 申请号: | 201911095971.8 | 申请日: | 2019-11-11 |
| 公开(公告)号: | CN112786000B | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 付涛;王鑫龙;彭守业 | 申请(专利权)人: | 亿度慧达教育科技(北京)有限公司 |
| 主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L25/18;G10L25/63 |
| 代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 李丽 |
| 地址: | 100039 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 合成 方法 系统 设备 存储 介质 | ||
1.一种语音合成方法,其特征在于,包括:
获取待语音合成的文本;
根据所述文本获取各文本单元矩阵;
根据预存的文本单元频谱序列获取各所述文本单元矩阵所对应的单元频谱矩阵,并获取各所述文本单元矩阵所对应的单元频谱帧数,其中,所述文本单元频谱序列存储有相互对应的所述文本单元矩阵和所述单元频谱矩阵,所述单元频谱帧数为所述文本单元矩阵的单元频谱矩阵的数量;
根据所述单元频谱帧数和所述单元频谱矩阵构建与所述文本对应的文本频谱矩阵;
对所述文本频谱矩阵进行语音合成,得到与所述文本对应的音频;
所述获取各所述文本单元矩阵所对应的单元频谱帧数的步骤包括:
获取所述文本单元矩阵的各个预估频谱帧数和与各所述预估频谱帧数对应的概率值;
将所述概率值中的最大概率值所对应的预估频谱帧数作为所述单元频谱帧数。
2.如权利要求1所述的语音合成方法,其特征在于,所述获取与各所述预估频谱帧数对应的概率值的步骤包括:
根据所述文本获取各所述文本单元矩阵的位置编码矩阵;
根据所述位置编码矩阵和所述文本单元矩阵,获取与各所述预估频谱帧数对应的概率值。
3.如权利要求1所述的语音合成方法,其特征在于,所述预存的文本单元频谱序列通过以下步骤获取:
获取已有样本音频每帧对应的样本单元频谱矩阵和样本文本单元矩阵;
对每个所述样本文本单元矩阵执行以下操作:
根据每个所述样本文本单元矩阵确定目标文本单元矩阵,获取与目标文本单元矩阵对应的多个样本单元频谱矩阵;计算对应于目标文本单元矩阵的多个样本预估单元频谱矩阵的平均值,得到与所述目标文本单元矩阵对应的目标单元频谱矩阵;
基于每个所述样本文本单元矩阵对应的目标单元频谱矩阵,得到预存的所述文本单元频谱序列。
4.如权利要求1所述的语音合成方法,其特征在于,还包括:
根据所述文本获取文本特征矩阵;
所述根据所述单元频谱帧数和所述单元频谱矩阵构建与所述文本对应的文本频谱矩阵的步骤包括:
根据所述单元频谱帧数和所述单元频谱矩阵构建与所述文本对应的初始文本频谱矩阵;
将所述文本特征矩阵和所述初始文本频谱矩阵进行矩阵融合,得到所述文本频谱矩阵。
5.如权利要求1-4任一项所述的语音合成方法,其特征在于,还包括:
获取情感矩阵;
所述根据所述单元频谱帧数和所述单元频谱矩阵构建与所述文本对应的文本频谱矩阵的步骤包括:
根据所述单元频谱帧数和所述单元频谱矩阵构建与所述文本对应的初始文本频谱矩阵;
将所述情感矩阵和所述初始文本频谱矩阵进行矩阵融合,得到所述文本频谱矩阵。
6.如权利要求5所述的语音合成方法,其特征在于,所述对所述文本频谱矩阵进行语音合成,得到与所述文本对应的音频的步骤包括:
对所述文本频谱矩阵和所述情感矩阵进行语音合成,得到与所述文本对应的音频。
7.如权利要求5所述的语音合成方法,其特征在于,所述获取情感矩阵的步骤包括:
获取情感类型标签;
根据所述情感类型标签从预存的情感矩阵库中获取所述情感矩阵。
8.如权利要求5所述的语音合成方法,其特征在于,所述获取情感矩阵的步骤包括:
获取情感类型音频;
提取所述情感类型音频的情感矩阵。
9.如权利要求8所述的语音合成方法,其特征在于,所述提取所述情感类型音频的情感矩阵的步骤包括:
利用情感矩阵提取模块提取所述情感类型音频的情感矩阵,所述情感矩阵提取模块的结构包括VGG-16神经网络的卷积结构和Inception卷积结构。
10.如权利要求1-4任一项所述的语音合成方法,其特征在于,所述文本单元矩阵包括文本字符矩阵或文本音素矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亿度慧达教育科技(北京)有限公司,未经亿度慧达教育科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911095971.8/1.html,转载请声明来源钻瓜专利网。





