[发明专利]声学模型建立、语音合成方法、装置、设备及存储介质有效

专利信息
申请号: 201811408961.0 申请日: 2018-11-23
公开(公告)号: CN109285537B 公开(公告)日: 2021-04-13
发明(设计)人: 张冉 申请(专利权)人: 北京羽扇智信息科技有限公司
主分类号: G10L13/04 分类号: G10L13/04;G10L13/06;G10L13/10
代理公司: 北京睿派知识产权代理事务所(普通合伙) 11597 代理人: 刘锋
地址: 100080 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 声学 模型 建立 语音 合成 方法 装置 设备 存储 介质
【说明书】:

发明实施例公开了一种声学模型建立、语音合成方法、装置、设备及存储介质,其中声学模型建立方法包括:从语料库中获取多个训练样本的音素序列样本,并获取所述音素序列样本中每个音素的上下文特征以及每个音素的时长;其中,所述音素序列样本中儿化音音素拆分成两个音素;从所述训练样本中提取声学特征;以所述音素序列样本,所述音素序列样本中每个音素的上下文特征和时长作为声学模型的输入,以所述声学特征作为所述声学模型的输出,对所述声学模型进行训练,得到预先训练的声学模型,可以使儿化音的建模性能较好,可以更好地实现儿化音的合成,可以合成语料库中未出现的儿化音,同时可以降低语料库中语料的录制成本。

技术领域

本发明实施例涉及信息语音合成领域,特别是涉及一种声学模型建立、语音合成方法、装置、设备及存储介质。

背景技术

随着多媒体通信技术的不断发展,作为人机交互重要方式之一的语音合成技术以其方便、快捷的优点受到了研究者的广泛关注。语音合成是通过机械的、电子的方法产生人造语音的技术,它是将计算机自己产生的或者外部输入的文字信息转变为可以听得懂的、流利的口语输出的技术。语音合成的目的是将文本转换为语音播放给用户,目标是达到真人文本播报的效果。

语音合成技术已经获得了广泛的应用,例如语音合成技术已经用于信息流、地图导航、阅读、翻译、智能家电等。其中,儿化是汉语普通话口语中颇具特色的一种音变现象,主要是由词尾“儿”变化而来。词尾“儿“本是一个独立音节,长期与其前面音节流利地连读而发生音变,“儿”失去独立性,“化”到前一个音节上,只保持一个卷舌动作,且使其前面音节里的韵母或多或少地发生变化,如“老头儿”、“鲜花儿”。儿化也是汉语普通话中一种非常重要的语言现象,经常在书面上出现,能起到区别词性和意义,表达不同感情色彩的作用。

现有技术中,在语音合成中,一般语料库中只录制少量的儿化音并进行标注。发明人在具体实施过程中,发现现有技术中存在如下问题:如果覆盖常见的应用场景,需要录制较多的语料才能建立对儿化音合成效果较佳的声学模型,但是语料录制成本较高;若儿化音录制较少,容易造成声学模型中儿化音建模较差的问题;也无法借用语料库中已有的韵母音素,对儿化音建模,并且无法合成语音合成库中没有出现的儿化音。

发明内容

本发明实施例提供了一种声学模型建立、语音合成方法、装置、设备及存储介质,可以使声学模型中儿化音的建模性能较好,可以更好地实现儿化音的合成,可以合成语料库中未出现的儿化音,可以降低语料库中语料的录制成本。

为了解决上述问题,本发明实施例主要提供如下技术方案:

第一方面,本发明实施例提供了一种声学模型建立方法,包括:

从语料库中获取多个训练样本的音素序列样本,并获取所述音素序列样本中每个音素的上下文特征以及每个音素的时长;其中,所述音素序列样本中儿化音音素拆分成两个音素;

从所述训练样本中提取声学特征;

以所述音素序列样本,所述音素序列样本中每个音素的上下文特征和时长作为声学模型的输入,以所述声学特征作为所述声学模型的输出,对所述声学模型进行训练,得到预先训练的声学模型

第二方面,本发明实施例还提供了一种语音合成方法,包括:

获取模块,用于从语料库中获取多个训练样本的音素序列样本,并获取所述音素序列样本中每个音素的上下文特征以及每个音素的时长;其中,所述音素序列样本中儿化音音素拆分成两个音素;

提取模块,用于从所述训练样本中提取声学特征;

训练模块,用于以所述音素序列样本,所述音素序列样本中每个音素的上下文特征和时长作为声学模型的输入,以所述声学特征作为所述声学模型的输出,对所述声学模型进行训练,得到预先训练的声学模型。

第三方面,本发明实施例提供了一种电子设备,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京羽扇智信息科技有限公司,未经北京羽扇智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811408961.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top