[发明专利]一种面向智能机器人的语音合成方法及装置有效

申请号：	201811376508.6	申请日：	2018-11-19
公开（公告）号：	CN109461435B	公开（公告）日：	2022-07-01
发明（设计）人：	贾志强;俞晓君	申请（专利权）人：	北京光年无限科技有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/08;G10L25/63
代理公司：	北京聿华联合知识产权代理有限公司 11611	代理人：	李哲伟;张文娟
地址：	100000 北京市石景山区石景山***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种面向智能机器人语音合成方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向智能机器人的语音合成方法，其特征在于，所述方法包括：

步骤一、获取声音合成参数配置指令；所述声音合成参数配置指令中所包含的声音合成参数包括：声音波动幅度、基频、语速、音量、混响开关以及朗读符号间隔时长；

步骤二、在对待转换文本信息进行TTS转换的过程中，基于所述声音合成参数配置指令，根据待转换文本的文本结构及文本所包含的情感参数，调整相应的声音合成参数，并基于调整后的声音合成参数对所述待转换文本信息进行TTS转换，得到所需要的音频信息；

在所述步骤二中，通过对待转换文本进行情感分析来确定所述情感参数，包括以下操作：

依据待转换文本的文本结构，根据文本中的朗读符号来对待转换文本进行分割；

对分割得到的各个语句进行特征词抽取；

根据抽取出的连词来确定句子中该连词前后的分词权重，针对否定词进行极性反转或者双重否定的识别；得到句法分析结果；

根据各语句中的情感词汇以及句法分析结果，综合确定出语句的情感评分，以表征语句的情感参数。

2.如权利要求1所述的方法，其特征在于，在所述步骤二中，基于调整后的声音合成参数，利用预先训练得到的TTS转换模型来对所述待转换文本信息进行TTS转换。

3.如权利要求2所述的方法，其特征在于，利用预设语料集合来训练得到所述TTS转换模型，其中，所述预设语料集合包括多个训练语料，各个训练语料包含有待转换文本的文本结构以及对应的声母韵母信息和发音起止时间信息。

4.如权利要求1～3中任一项所述的方法，其特征在于，在所述调整相应的声音合成参数时，获取语音合成标签，所述语音合成标签包含：针对于特定交互场景的多个声音合成参数以及情感参数。

5.一种程序产品，其上存储有可执行如权利要求1～4中任一项所述的方法步骤的程序代码。

6.一种面向智能机器人的人机交互系统，其特征在于，所述系统装配有操作系统，所述操作系统能够装载并执行如权利要求5所述的程序产品。

7.一种面向智能机器人的语音合成装置，其特征在于，所述装置包括：

指令获取模块，其用于获取声音合成参数配置指令；所述声音合成参数配置指令中所包含的声音合成参数包括：声音波动幅度、基频、语速、音量、混响开关以及朗读符号间隔时长；

TTS转换模块，其用于在对待转换文本信息进行TTS转换的过程中，基于所述声音合成参数配置指令，根据待转换文本的文本结构及文本所包含的情感参数，调整相应的声音合成参数，并基于调整后的声音合成参数对所述待转换文本信息进行TTS转换，得到所需要的音频信息；

所述TTS转换模块配置为通过以下操作对待转换文本进行情感分析来确定所述情感参数：

依据待转换文本的文本结构，根据文本中的朗读符号来对待转换文本进行分割；

对分割得到的各个语句进行特征词抽取；

根据抽取出的连词来确定句子中该连词前后的分词权重，针对否定词进行极性反转或者双重否定的识别；得到句法分析结果；

根据各语句中的情感词汇以及句法分析结果，综合确定出语句的情感评分，以表征语句的情感参数。

8.如权利要求7所述的装置，其特征在于，所述TTS转换模块配置为基于调整后的声音合成参数，利用预先训练得到的TTS转换模型来对所述待转换文本信息进行TTS转换；

利用预设语料集合来训练得到所述TTS转换模型，其中，所述预设语料集合包括多个训练语料，各个训练语料包含有待转换文本的文本结构对应的声母韵母信息和发音起止时间信息；

在所述调整相应的声音合成参数时，所述指令获取模块配置为获取语音合成标签，所述语音合成标签包含：针对于特定交互场景的多个声音合成参数，以及所述文本所包含的情感参数。

9.一种儿童专用智能设备，其特征在于，所述设备包括智能机器人和云端服务器，所述智能机器人和云端服务器配合地执行如权利要求1～4中任一项所述的语音合成方法，用以获取声音合成参数配置指令，并根据所获取到的声音合成参数配置指令以及待转换文本的文本结构和文本所包含的情感参数来调整相应的声音合成参数，进而利用调整后的声音合成参数来对待转换文本信息进行TTS转换，从而得到所需要的音频信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京光年无限科技有限公司，未经北京光年无限科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811376508.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于锯齿形声子晶体梁的薄板中弯曲波控制装置
下一篇：一种语音识别发音错误的纠正方法及系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向智能机器人的语音合成方法及装置有效

专利文献下载