[发明专利]声学模型建立、语音合成方法、装置、设备及存储介质有效
申请号: | 201811408961.0 | 申请日: | 2018-11-23 |
公开(公告)号: | CN109285537B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 张冉 | 申请(专利权)人: | 北京羽扇智信息科技有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/06;G10L13/10 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声学 模型 建立 语音 合成 方法 装置 设备 存储 介质 | ||
1.一种声学模型建立方法,其特征在于:包括:
从语料库中获取多个训练样本的音素序列样本,并获取所述音素序列样本中每个音素的上下文特征以及每个音素的时长;其中,所述音素序列样本中儿化音音素的非儿化部分和儿化部分拆分,得到两个音素,所述儿化部分的音素带有标识;
从所述训练样本中提取声学特征;
以所述音素序列样本,所述音素序列样本中每个音素的上下文特征和时长作为声学模型的输入,以所述声学特征作为所述声学模型的输出,对所述声学模型进行训练,得到预先训练的声学模型。
2.根据权利要求1所述的方法,其特征在于,还包括:
将所述音素序列样本以及所述音素序列样本中每个音素的上下文特征作为时长模型的输入,以所述音素序列样本中每个音素的时长作为所述时长模型的输出,对所述时长模型进行训练,得到预先训练的时长模型。
3.根据权利要求1所述的方法,其特征在于,所述儿化音的音素拆分成的两个音素的时长之和,等于所述儿化音的音素在拆分之前的时长。
4.根据权利要求1所述的方法,其特征在于,所述上下文特征包括每个音素在所述音素序列样本中的位置,在每个音素之前的音素以及在每个音素之后的音素。
5.一种语音合成方法,其特征在于,包括:
获取待合成文本;
确定与所述待合成文本对应的音素序列,其中,所述待合成文本中的儿化音的音素的非儿化部分和儿化部分拆分,得到两个音素,所述儿化部分的音素带有标识;
确定所述音素序列中每个音素的上下文特征,并基于预先训练的时长模型确定每个音素的时长;
以所述音素序列,所述音素序列中每个音素的上下文特征和时长输入到预先训练的声学模型中,得到所述待合成文本的声学特征;
基于所述声学特征,合成所述待合成文本的语音。
6.一种声学模型建立装置,其特征在于:包括:
获取模块,用于从语料库中获取多个训练样本的音素序列样本,并获取所述音素序列样本中每个音素的上下文特征以及每个音素的时长;其中,所述音素序列样本中儿化音音素的非儿化部分和儿化部分拆分,得到两个音素,所述儿化部分的音素带有标识;
提取模块,用于从所述训练样本中提取声学特征;
训练模块,用于以所述音素序列样本,所述音素序列样本中每个音素的上下文特征和时长作为声学模型的输入,以所述声学特征作为所述声学模型的输出,对所述声学模型进行训练,得到预先训练的声学模型。
7.一种语音合成装置,其特征在于,包括:
获取模块,用于获取待合成文本;
第一确定模块,用于确定与所述待合成文本对应的音素序列,其中,所述待合成文本中的儿化音的音素的非儿化部分和儿化部分拆分,得到两个音素,所述儿化部分的音素带有标识;
第二确定模块,用于确定所述音素序列中每个音素的上下文特征,并基于预先训练的时长模型确定每个音素的时长;
声学特征确定模块,用于以所述音素序列样本,所述音素序列样本中每个音素的上下文特征和时长输入到预先训练的声学模型中,得到所述待合成文本的声学特征;
合成模块,用于基于所述声学特征,合成所述待合成文本的语音。
8.一种电子设备,其特征在于,包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行权利要求1-4任一项所述声学模型建立方法,或者执行权利要求5所述的一种语音合成方法。
9.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行权利要求1-4任一项所述的声学模型建立方法,或者执行权利要求5所述的一种语音合成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京羽扇智信息科技有限公司,未经北京羽扇智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811408961.0/1.html,转载请声明来源钻瓜专利网。