[发明专利]语音合成方法和系统有效
申请号: | 201510441079.6 | 申请日: | 2015-07-24 |
公开(公告)号: | CN104992703B | 公开(公告)日: | 2017-10-03 |
发明(设计)人: | 李秀林;白洁;李维高;唐海员 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 方法 系统 | ||
1.一种语音合成方法,其特征在于,包括:
在需要语音合成时,从服务端查询可用音库列表,所述可用音库列表中包括多个可用音库的信息,所述可用音库包括特色音库;
获取用户根据所述可用音库列表选择的音库,并从服务端下载用户选择的音库;
采用下载的音库,将文本合成为语音;
其中,所述从服务端查询可用音库列表,包括:
向服务端发送查询请求,所述查询请求中包含查询条件,使得所述服务端根据所述查询条件获取查询结果,其中,当第一集群系统中存在所述查询结果时,从所述第一集群系统中获取所述查询结果,或者,当所述第一集群系统中不存在所述查询结果时,从第二集群系统中获取所述查询结果,并将获取的查询结果缓存到所述第一集群系统中;所述查询结果包括特色声音;
接收所述服务端发送的可用音库列表,所述可用音库列表是所述服务端根据所述查询结果获取的;
所述可用音库的信息包括:在创建可用音库后对应生成的信息,所述信息被存储在服务端的第二集群系统中。
2.根据权利要求1所述的方法,其特征在于,还包括:创建特色音库,所述创建特色音库包括:
建立特色声学模型和获取声学片断,由所述特色声学模型和所述声学片断组成特色音库;或者,
建立特色声学模型,由所述特色声学模型组成特色音库;或者,
获取与特定文本对应的声音数据,由所述特定文本与所述声音数据组成特色音库;或者,
建立特色声学模型、获取声学片断,以及,获取与特定文本对应的声音数据,由所述特色声学模型,声学片断,以及,所述特定文本与所述声音数据组成特色音库;或者,
建立特色声学模型,获取与特定文本对应的声音数据,由所述特色声学模型,以及,所述特定文本与所述声音数据组成特色音库。
3.根据权利要求2所述的方法,其特征在于,所述建立特色声学模型,包括:
获取特色声音数据,并对所述特色声音数据进行训练,建立特色声学模型;或者,
获取已有的声学模型和特色声音数据,根据所述特色声音数据对所述已有的声学模型进行自适应训练,建立特色声学模型。
4.根据权利要求2所述的方法,其特征在于,所述获取与特定文本对应的声音数据,包括:
选取要朗诵的特定文本;
获取特定发音人对所述特定文本的朗诵语音;
将所述朗诵语音或者对所述朗诵语音进行压缩处理后的语音作为与所述特定文本对应的声音数据。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述可用音库的信息包括:可用音库的链接信息,所述从服务端下载用户选择的音库,包括:
根据所述链接信息从服务端下载对应的音库,其中,所述链接信息是存储可用音库后的存储地址。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述采用下载的音库,将文本合成为语音,包括:
当所述音库内包括声学模型和声学片断时,对文本进行处理,根据处理后的文本和所述声学模型获取声学参数,并根据所述声学参数获取对应的声学片断,以及,对获取的声学片断进行拼接合成,获取合成语音;或者,
当所述音库内包括声学模型时,对文本进行处理,根据处理后的文本和所述声学模型获取声学参数,根据所述声学参数进行声码器参数合成,获取合成语音;或者,
当所述音库内包括声学模型、特定文本与对应的声音数据时,对文本进行预处理,在所述音库内存在与预处理后的文本一致的特定文本时,获取与所述特定文本对应的声音数据,将所述声音数据或者对所述声音数据进行解压缩处理后的声音数据作为合成语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510441079.6/1.html,转载请声明来源钻瓜专利网。