[发明专利]语音合成方法和系统有效

专利信息
申请号: 201510441079.6 申请日: 2015-07-24
公开(公告)号: CN104992703B 公开(公告)日: 2017-10-03
发明(设计)人: 李秀林;白洁;李维高;唐海员 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G10L13/02 分类号: G10L13/02
代理公司: 北京清亦华知识产权代理事务所(普通合伙)11201 代理人: 宋合成
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 合成 方法 系统
【说明书】:

技术领域

发明涉及语音处理技术领域,尤其涉及一种语音合成方法和系统。

背景技术

现有技术中,用户在下载离线语音合成应用程序(APP)时,该APP内会包含一个或两个音库,用户在使用该APP时,会选择一种音库,之后该APP使用用户选择的音库对要播放的文本进行语音合成(Text To Speech,TTS)。

但是,现有技术的方案,一方面在APP中包含音库,由于音库文件一般都比较大,会造成APP的体积较大,另一方面APP包含的音库种类有限,致使用户选择空间有限。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本发明的一个目的在于提出一种语音合成方法,该方法可以降低离线语音合成APP的体积,并且可以为用户提供更多选择,实现个性化语音合成。

本发明的另一个目的在于提出一种语音合成系统。

为达到上述目的,本发明第一方面实施例提出的语音合成方法,包括:在需要语音合成时,从服务端查询可用音库列表,所述可用音库列表中包括多个可用音库的信息,所述可用音库包括特色音库;获取用户根据所述可用音库列表选择的音库,并从服务端下载用户选择的音库;采用下载的音库,将文本合成为语音。

本发明第一方面实施例提出的语音合成方法,通过在语音合成时从服务端下载音库,而不是直接在APP中包含音库,可以降低APP的体积,另外,相对于在APP内包含音库的方式,服务端内可以存储更多的音库,通过在服务端下载音库,可以为用户提供更多的选择,通过可用音库内包括特色音库,可以满足用户个性化需求,提升用户体验。

为达到上述目的,本发明第二方面实施例提出的语音合成系统,包括:客户端装置,所述客户端装置包括:查询模块,用于在需要语音合成时,从服务端查询可用音库列表,所述可用音库列表中包括多个可用音库的信息,所述可用音库包括特色音库;获取模块,用于获取用户根据所述可用音库列表选择的音库,并从服务端下载用户选择的音库;合成模块,用于采用下载的音库,将文本合成为语音。

本发明第二方面实施例提出的语音合成系统,通过在语音合成时从服务端下载音库,而不是直接在APP中包含音库,可以降低APP的体积,另外,相对于在APP内包含音库的方式,服务端内可以存储更多的音库,通过在服务端下载音库,可以为用户提供更多的选择,通过可用音库内包括特色音库,可以满足用户个性化需求,提升用户体验。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1是本发明一实施例提出的语音合成方法的流程示意图;

图2是本发明另一实施例提出的语音合成的方法的流程示意图;

图3是本发明实施例中语音合成系统一种具体示例的示意图;

图4是本发明实施例中一种具体示例的语音合成的流程示意图;

图5是本发明实施例中另一种具体示例的语音合成的流程示意图;

图6是本发明实施例中另一种具体示例的语音合成的流程示意图;

图7是本发明实施例中另一种具体示例的语音合成的流程示意图;

图8是本发明另一实施例提出的语音合成系统的结构示意图;

图9是本发明另一实施例提出的语音合成系统的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

图1是本发明一实施例提出的语音合成方法的流程示意图,该方法包括:

S11:在需要语音合成时,从服务端查询可用音库列表,所述可用音库列表中包括多个可用音库的信息,所述可用音库包括特色音库。

与现有技术中直接在APP内包含音库不同的是,本实施例中,不需要在APP内包含音库,而是在需要音库时从服务端下载。

例如,客户端上APP对应的软件开发工具包(Software Development Kit,SDK)向服务端发送查询请求,该查询请求用于请求可用音库列表,服务端接收到该查询请求后获取可用音库列表,并将获取的可用音库列表发送给SDK。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510441079.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top