[发明专利]一种基于文本信息的波形拼接语音合成方法在审
申请号: | 201410816486.6 | 申请日: | 2014-12-25 |
公开(公告)号: | CN104575488A | 公开(公告)日: | 2015-04-29 |
发明(设计)人: | 徐明星 | 申请(专利权)人: | 北京时代瑞朗科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08 |
代理公司: | 无 | 代理人: | 无 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于文本信息的波形拼接语音合成方法,该方法包括以下步骤:通过音段切分,提取原始音频中所有基元的声学参数与文本参数,根据提取的参数训练时长预测模型与训练权重预测模型;采用分层预选方法,进行分层预选,利用文本分析的目标基元、时长预测模型预测的时长对语料库中的基元进行初步预选,获得候选基元;对目标基元、候选基元和权重预测模型预测的权重信息计算,获得目标代价;对相邻两个基元的契合度进行计算,得到拼接代价;用维特比搜索方法对目标代价和拼接代价进行搜索,得到最小代价路径,进而得到最佳基元并经过平滑拼接得到合成语音。本发明提高了合成语音的效率,增强拼接合成的实时性并提高了合成语音的韵律表现。 | ||
搜索关键词: | 一种 基于 文本 信息 波形 拼接 语音 合成 方法 | ||
【主权项】:
一种基于文本信息的波形拼接语音合成方法,其特征在于:该方法包括以下步骤:步骤S1:通过音段切分,提取原始音频中所有基元的声学参数与文本参数,根据提取的参数训练时长预测模型与训练权重预测模型;步骤S2:采用分层预选方法,进行分层预选,利用文本分析的目标基元、时长预测模型预测的时长对语料库中的基元进行初步预选,获得候选基元;步骤S3:对目标基元、候选基元和权重预测模型预测的权重信息计算,获得目标代价;对相邻两个基元的契合度进行计算,得到拼接代价;用维特比搜索方法对目标代价和拼接代价进行搜索,得到最小代价路径,进而得到最佳基元并经过平滑拼接得到合成语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京时代瑞朗科技有限公司;,未经北京时代瑞朗科技有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410816486.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能优盘
- 下一篇:栅极脉冲调变电路及其削角调变方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置