[发明专利]拼接语音音频的方法、装置以及存储介质在审

专利信息
申请号: 201910913308.8 申请日: 2019-09-25
公开(公告)号: CN112562637A 公开(公告)日: 2021-03-26
发明(设计)人: 黄磊;杨春勇;权圣 申请(专利权)人: 北京中关村科金技术有限公司
主分类号: G10L13/033 分类号: G10L13/033
代理公司: 北京万思博知识产权代理有限公司 11694 代理人: 刘冀
地址: 100000 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 拼接 语音 音频 方法 装置 以及 存储 介质
【说明书】:

本申请公开了一种拼接语音音频的方法、装置以及存储介质。其中,该方法包括:获取用于拼接的第一语音音频和第二语音音频;生成过渡音频,过渡音频用于衔接第一语音音频和第二语音音频;以及将过渡音频插入到第一语音音频和第二语音音频之间,并且将第一语音音频、过渡音频以及第二语音音频进行拼接,生成拼接语音音频。解决了语音合成过程中需要对音频片段进行拼接,由于音频片段的拼接处不够平滑,因此与真人录音相比自然度较差的技术问题。

技术领域

本申请涉及计算机和人工智能领域,特别是涉及一种拼接语音音频的方法、装置以及存储介质。

背景技术

目前TTS(Text To Speech)的拼接合成技术是通过将录音员所录的录音,根据标注格式,切割成一段一段的录音,当合成文本传入后,会根据单元挑选合适的录音进行拼接合成。例如合成人名张三,录音库里面分别存了‘张’、‘三’,通过合成这两个字来生成‘张三’的音频。虽然这种合成方式在整体上会显得比较自然,但是在切割处拼接的时候会存在过渡不够平滑的问题,主要体现在姓名的合成上。现有技术一般采用TD-PSOLA算法解决这个问题,而TD-PSOLA算法在拼接过程中出现声音信号值较多的情况使用效果不佳,此外还存在合成不自然的问题,因此合成语音的自然度跟真人录音相比效果比较差。

针对上述的现有技术中存在的语音合成过程中需要对音频片段进行拼接,由于音频片段的拼接处不够平滑,因此与真人录音相比自然度较差的技术问题,目前尚未提出有效的解决方案。

发明内容

本公开的实施例提供了一种拼接语音音频的方法、装置以及存储介质,以至少解决现有技术中存在的文字转语音的过程中需要进行音频片段的拼接,由于音频片段的拼接处不够平滑,因此与真人录音相比自然度较差的技术问题。

根据本公开实施例的一个方面,提供了一种拼接语音音频的方法,包括:获取用于拼接的第一语音音频和第二语音音频;生成过渡音频,过渡音频用于衔接第一语音音频和第二语音音频;以及将过渡音频插入到第一语音音频和第二语音音频之间,并且将第一语音音频、过渡音频以及第二语音音频进行拼接,生成拼接语音音频。

根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。

根据本公开实施例的另一个方面,还提供了一种拼接语音音频的装置,包括:获取模块,用于获取用于拼接的第一语音音频和第二语音音频;生成模块,用于生成过渡音频,过渡音频用于衔接第一语音音频和第二语音音频;以及拼接模块,用于将过渡音频插入到第一语音音频和第二语音音频之间,并且将第一语音音频、过渡音频以及第二语音音频进行拼接,生成拼接语音音频。

根据本公开实施例的另一个方面,还提供了一种拼接语音音频的装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取用于拼接的第一语音音频和第二语音音频;生成过渡音频,过渡音频用于衔接第一语音音频和第二语音音频;以及将过渡音频插入到第一语音音频和第二语音音频之间,并且将第一语音音频、过渡音频以及第二语音音频进行拼接,生成拼接语音音频。

在本公开实施例中,通过获取用于拼接的两个音频片段,然后生成用于平滑衔接两个音频片段的过渡音频,最终将所生成的过渡音频插入到两个音频片段之间,生成拼接语音音频。达到了在语音合成过程中可以平滑拼接连续的两个音频片段的目的,从而实现了增强合成语音的自然度和协调性,降低合成语音存在的机械感的技术效果。进而解决了现有技术中存在的语音合成过程中需要对音频片段进行拼接,由于音频片段的拼接处不够平滑,因此与真人录音相比自然度较差的技术问题。

附图说明

此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:

图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中关村科金技术有限公司,未经北京中关村科金技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910913308.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top