[发明专利]语音合成编码方法及装置在审

申请号：	202110647984.2	申请日：	2021-06-10
公开（公告）号：	CN113380220A	公开（公告）日：	2021-09-10
发明（设计）人：	皮碧虹;杨德文;龙丁奋	申请（专利权）人：	深圳市同行者科技有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/04
代理公司：	深圳市特讯知识产权代理事务所(普通合伙) 44653	代理人：	孟智广
地址：	518000 广东省深圳市南山区粤海街道高***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成编码方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书一个或多个实施例提供的一种语音合成编码方法及装置，在开始将文本数据合成为pcm流数据后，根据当前系统负载情况动态计算开始播放需要的起始缓冲阈值Tstart，若缓冲区缓冲时长大于所述起始缓冲阈值Tstart时，读取缓冲区的所述pcm流数据进行播放；并根据当前系统负载情况动态计算持续播放需要的持续缓冲阈值Tblock；播放过程中，根据缓冲区缓冲时长与持续缓冲阈值Tblock的关系，判断是继续将文本数据合成为pcm流数据还是暂停合成，既保证了播放的稳定性流畅度，也实现了cpu和内存的平滑占用。

技术领域

本发明涉及语音合成方法技术领域，特别是指一种语音合成编码方法及装置。

背景技术

当前语音合成(文本转语音)的编码播放方案有:

1、一次性合成：将文本输入到语音合成引擎，一次性获得编码后的pcm数据，将pcm数据一次性传递给播放器播放；该方式需要占用大量的内存存储pcm，并且合成等待时长较长，需要等数据全部合成后才开始播放。

2、流式合成中睡眠：一边合成pcm数据，一边塞给播放器处理，在合成过程中睡眠一定时间，继续合成并播放；该方式单次合成的数据块大小固定，存在cpu波动，sleep时间过短可能占用cpu过高，sleep时间过长可能造成播放器断播或出现杂音。

发明内容

有鉴于此，本说明书一个或多个实施例的目的在于提出一种语音合成编码方法及装置，能够有效的解决现有技术技术中的技术问题。

基于上述目的，本说明书一个或多个实施例提供了一种语音合成编码方法，包括：

开始将文本数据合成为pcm流数据，并将所述pcm流数据存储于缓冲区；

根据当前系统负载情况动态计算开始播放需要的起始缓冲阈值Tstart；

若缓冲区缓冲时长大于所述起始缓冲阈值Tstart时，读取缓冲区的所述pcm流数据进行播放；