[发明专利]残差网络的训练和语音合成方法、装置、设备及介质在审
| 申请号: | 202011406146.8 | 申请日: | 2020-12-03 |
| 公开(公告)号: | CN112562655A | 公开(公告)日: | 2021-03-26 |
| 发明(设计)人: | 朱晓旭;张大成 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
| 主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L13/02;G10L19/16 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 杜晶 |
| 地址: | 100025 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络 训练 语音 合成 方法 装置 设备 介质 | ||
1.一种残差网络的训练方法,其特征在于,所述方法包括:
针对样本集中任一语音样本中的每个语音帧,该语音帧在每个采样点均对应有第一残差信号值,所述第一残差信号值是根据该语音帧在该采样点的真实信号值与预测信号值确定的;其中,该语音帧在该采样点的预测信号值是根据该语音帧的声学特征向量以及物理声码器确定的;
针对所述语音样本所包含的每个语音帧,通过原始残差网络中的帧级别子网络,基于该语音帧的声学特征向量,获取该语音帧的条件向量;通过所述原始残差网络中的采样点子网络,针对每个采样点,根据所述条件向量以及该语音帧在上一个采样点的第一残差信号值,获取该语音帧在当前采样点的高斯参数向量;基于所述高斯参数向量,确定该语音帧在当前采样点的第二残差信号值;其中,所述高斯参数向量中包括设定数量的高斯算法分别对应的权重值、高斯均值以及高斯标准差;
根据所述语音样本所包含的每个语音帧在每个采样点的第一残差信号值以及第二残差信号值,对所述原始残差网络进行训练。
2.根据权利要求1所述的方法,其特征在于,所述基于所述高斯参数向量,确定该语音帧在当前采样点的第二残差信号值,包括:
针对每个所述高斯算法,确定所述高斯参数向量中该高斯算法对应的参数信息;
基于每个所述高斯算法对应的参数信息,确定该语音帧在当前采样点的第二残差信号值。
3.根据权利要求2所述的方法,其特征在于,所述基于每个所述高斯算法对应的参数信息,确定该语音帧在当前采样点的第二残差信号值,包括:
针对每个所述高斯算法,根据该高斯算法对应的参数信息中的高斯均值以及高斯标准差,确定该高斯算法对应的高斯残差值;根据每个所述高斯算法对应的参数信息中的权重值、以及每个所述高斯算法对应的高斯残差值,确定该语音帧在当前采样点的第二残差信号值;或
将每个所述参数信息中的权重值拼接为权重向量;根据所述权重向量以及归一化函数,确定归一化权重向量;从所述归一化权重向量包含的每个特征元素中确定目标特征元素;确定所述目标特征元素对应的高斯算法,并根据该高斯算法对应的参数信息中的高斯均值以及高斯标准差,确定该高斯算法对应的高斯残差值,并将所述高斯残差值确定为该语音帧在当前采样点的第二残差信号值。
4.根据权利要求3所述的方法,其特征在于,所述根据该高斯算法对应的参数信息中的高斯均值以及高斯标准差,确定该高斯算法对应的高斯残差值,包括:
根据该高斯算法对应的参数信息中的高斯均值、高斯标准差以及预先配置的随机值,确定该高斯算法对应的高斯残差值,其中,所述随机值为预先配置的随机范围中的任一个数值。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述第一残差信号值以及所述第二残差信号值均为浮点型数据。
6.一种基于权利要求1-5任一项方法训练得到的残差网络的语音合成方法,其特征在于,所述方法包括:
通过语音合成模型,基于待处理文本的文本特征,获取所述待处理文本对应的至少一个声学特征向量;
针对每个所述声学特征向量,通过物理声码器,基于该声学特征向量,获取该声学特征向量对应的语音帧的预测语音信号;并通过残差网络,基于该声学特征向量,获取该声学特征向量对应的语音帧在每个采样点的第二残差信号值;针对每个采样点,确定该采样点在所述预测语音信号中对应的预测信号值,根据所述预测信号值、以及该声学特征向量对应的语音帧在该采样点的第二残差信号值,确定该声学特征向量对应的语音帧在该采样点的合成信号值;
依次根据每个所述声学特征向量分别对应的语音帧在每个采样点的合成信号值,确定所述待处理文本对应的合成语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011406146.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全自动的药片智能化加工工艺
- 下一篇:一种矿用保护器通讯无线传输装置





