[发明专利]语音合成方法及装置在审
申请号: | 201811318970.0 | 申请日: | 2018-11-07 |
公开(公告)号: | CN109584859A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 周广益 | 申请(专利权)人: | 上海指旺信息科技有限公司 |
主分类号: | G10L13/027 | 分类号: | G10L13/027;G10L13/08;G10L15/02;G10L15/06;G10L15/26;G06F16/63;G11B20/10 |
代理公司: | 北京卓唐知识产权代理有限公司 11541 | 代理人: | 唐海力;李志刚 |
地址: | 201900 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征文字 目标文字 音频文件 目标音频 音频录制 语音合成 固定文字 技术效果 音频处理 语音播放 语音文件 拟人化 拼接 申请 机器人 录制 合成 播放 | ||
1.一种语音合成方法,获取用于语音播放的目标文字信息,其特征在于,所述方法包括:
根据所述目标文字信息中的固定文字,得到第一音频文件;
识别并提取所述目标文字信息中的特征文字,得到特征文字信息;
对所述特征文字信息进行音频录制,得到第二音频文件;以及
将所述第一音频文件和所述第二音频文件进行拼接,得到目标音频文件。
2.根据权利要求1所述的语音合成方法,其特征在于,所述特征文字信息包括:姓名信息、金额信息和日期信息中的至少一种。
3.根据权利要求1所述的语音合成方法,其特征在于,所述对特征文字信息进行音频录制,得到第二音频文件包括:
提取所述第一音频文件中的音频特征信息;
通过训练语料对预设机器学习模型进行特征训练,得到所述第二音频文件,其中,所述训练语料包括所述音频特征信息和所述特征文字信息。
4.根据权利要求1所述的语音合成方法,其特征在于,所述对特征文字信息进行音频录制,得到第二音频文件包括:
对所述特征文字信息中的每个特征文字进行拼音拆解,得到每个所述特征文字的拼音字母和拼音声调;
根据所述特征文字的拼音字母和拼音声调,生成对应的所述第二音频文件。
5.根据权利要求1所述的语音合成方法,其特征在于,所述根据目标文字信息中的固定文字,得到第一音频文件包括:
识别并提取所述目标文字信息中的固定文字,并将所述固定文字划分为多个固定文字编组;
判断预设音频数据库中是否包含每个所述固定文字编组所对应的第三音频文件;以及
如果判定所述预设音频数据库中包含有每个所述固定文字编组所对应的第三音频文件,则提取并合并所述第三音频文件,得到所述第一音频文件。
6.根据权利要求1所述的语音合成方法,其特征在于,所述将第一音频文件和所述第二音频文件进行拼接,得到目标音频文件包括:
根据所述目标文字信息和预设划分规则,得到所述第一音频文件和所述第二音频文件的拼接位置;
根据所述拼接位置拼接所述第一音频文件和所述第二音频文件,得到目标音频文件。
7.一种语音合成装置,获取用于语音播放的目标文字信息,包括:
第一音频文件获取单元,用于根据所述目标文字信息中的固定文字,得到第一音频文件;
特征文字信息提取单元,用于识别并提取所述目标文字信息中的特征文字,得到特征文字信息;
第二音频文件获取单元,用于对所述特征文字信息提取单元提取得到的特征文字信息进行音频录制,得到第二音频文件;以及
音频合成单元,用于将所述第一音频文件和所述第二音频文件进行拼接,得到目标音频文件。
8.根据权利要求7所述的语音合成装置,其特征在于,所述第二音频文件获取单元包括:
音频特征信息提取模块,用于提取所述第一音频文件中的音频特征信息;
模型训练模块,用于通过训练语料对预设机器学习模型进行特征训练,得到所述第二音频文件,其中,所述训练语料包括所述音频特征信息提取模块提取得到的音频特征信息和所述特征文字信息提取单元提取得到的特征文字信息。
9.根据权利要求7所述的语音合成装置,其特征在于,所述第二音频文件获取单元包括:
固定文字编组模块,用于识别并提取所述目标文字信息中的固定文字,并将所述固定文字划分为多个固定文字编组;
判断模块,用于判断预设音频数据库中是否包含每个所述固定文字编组所对应的第三音频文件;以及
第二音频文件合成模块,用于如果判定所述预设音频数据库中包含有每个所述固定文字编组所对应的第三音频文件,则提取并合并所述第三音频文件,得到所述第一音频文件。
10.根据权利要求7所述的语音合成装置,其特征在于,所述音频合成单元包括:
拼接位置确定模块,用于根据所述目标文字信息和预设划分规则,得到所述第一音频文件和所述第二音频文件的拼接位置;
音频拼接模块,用于根据所述拼接位置拼接所述第一音频文件和所述第二音频文件,得到目标音频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海指旺信息科技有限公司,未经上海指旺信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811318970.0/1.html,转载请声明来源钻瓜专利网。