[发明专利]一种语音合成方法、装置、电子设备及存储介质在审
| 申请号: | 202011194165.9 | 申请日: | 2020-10-30 |
| 公开(公告)号: | CN112382266A | 公开(公告)日: | 2021-02-19 |
| 发明(设计)人: | 顾宇 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
| 主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L15/26 |
| 代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 合成 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种语音合成方法、装置、电子设备及存储介质。方法包括:通过语音识别系统对采集的声音进行识别获得第一识别文本,并将采集的声音和第一识别文本构成样本数据;根据样本数据对初始语音合成系统进行校准;将待合成文本输入校准完成的语音合成系统获得合成语音信号。根据采集的声音获取第一识别文本,并将采集的声音和第一识别文本作为样本数据,并通过无需人工检查核对的样本数据对初始语音合成系统进行自动校准,并通过校准完成的语音合成系统进行语音的合成,从而节省了人工成本并提高了语音合成的效率。
技术领域
本公开实施例涉及数据处理技术领域,尤其涉及一种语音合成方法、装置、电子设备及存储介质。
背景技术
语音合成,又称文本转换(Text To Speech,TTS)技术,能够将文本转换成语音,即将文字信息转化为可听的声音信息,涉及声学、语音学、数字信号处理以及计算机科学。
目前在进行语音合成时,通常采用样本对语音合成系统进行训练,并采用训练完成的语音合成系统进行语音的合成,但是在进行训练时通常需要采用人工的方式对样本进行检查核对,以使样本中的文本和语音是匹配对应的,因此需要消耗大量的人工成本,并且影响语音合成的效率。
发明内容
本公开实施例提供了一种语音合成方法、装置、电子设备及存储介质,以实现语音的自动合成。
第一方面,本公开实施例提供了一种语音合成方法,包括:
通过语音识别系统对采集的声音进行识别获得第一识别文本,并将采集的声音和第一识别文本构成样本数据;
根据样本数据对初始语音合成系统进行校准;
将待合成文本输入校准完成的语音合成系统获得合成语音信号。
第二方面,本公开实施例还提供了一种语音合成装置,该装置包括:
样本数据获取模块,用于通过语音识别系统对采集的声音进行识别获得第一识别文本,并将采集的声音和第一识别文本构成样本数据;
校准模块,用于根据样本数据对初始语音合成系统进行校准;
语音合成模块,用于将待合成文本输入校准完成的语音合成系统获得合成语音信号。
第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如本公开任意实施例的方法。
第四方面,本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开任意实施例的方法。
本公开实施例中,根据采集的声音获取第一识别文本,并将采集的声音和第一识别文本作为样本数据,并通过无需人工检查核对的样本数据对初始语音合成系统进行自动校准,并通过校准完成的语音合成系统进行语音的合成,从而节省了人工成本并提高了语音合成的效率。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1是本公开实施例一提供的一种语音合成方法的流程图;
图2是本公开实施例二提供的一种语音合成方法的流程图;
图3是本公开实施例三提供的一种语音合成装置的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011194165.9/2.html,转载请声明来源钻瓜专利网。





