[发明专利]一种模拟用户说话的语音合成方法及系统在审
申请号: | 201711080690.6 | 申请日: | 2017-11-06 |
公开(公告)号: | CN107833572A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 孟猛 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/033;G10L13/04;G10L15/26;G10L15/02 |
代理公司: | 上海申新律师事务所31272 | 代理人: | 党蕾 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模拟 用户 说话 语音 合成 方法 系统 | ||
1.一种模拟用户说话的语音合成方法,其特征在于,包括:
步骤S1,获取外部输入的一段待模拟语音;
步骤S2,将所述待模拟语音识别为对应的包括多个顺序排列的基本音子的发音文本;
步骤S3,根据所述待模拟语音分别处理得到所述发音文本中每个基本音子的发音时段信息;
步骤S4,将所述发音文本和所述发音时段信息送入包括一预先训练形成的语音合成模型的语音合成器中,以得到对应于所述待模拟语音的合成语音并输出。
2.如权利要求1所述的语音合成方法,所述步骤S3中,所述发音时段信息包括所述基本音子的起始发音时刻和终止发音时刻。
3.如权利要求1所述的语音合成方法,其特征在于,所述步骤S3中,采用维特比方法分别处理得到每个所述基本音子的所述发音时段信息。
4.如权利要求1所述的语音合成方法,其特征在于,所述步骤S1中,在获取所述待模拟语音时,获取所述待模拟语音的基频信息;
则所述步骤S4中,将所述待模拟语音的所述基频信息作为所述语音合成器的基频信息,以处理得到所述合成语音。
5.如权利要求1所述的语音合成方法,其特征在于,所述步骤S4中,采用所述语音合成器中预设的音色处理得到所述合成语音。
6.一种模拟用户说话的语音合成系统,其特征在于,包括:
语音获取单元,用于获取外部输入的一段待模拟语音;
语音识别单元,连接所述语音获取单元,用于将所述待模拟语音识别为对应的发音文本,所述发音文本中包括多个顺序排列的基本音子;
处理单元,连接所述语音识别单元,用于根据所述待模拟语音分别处理得到所述发音文本中每个基本音子的发音时段信息;
合成单元,分别连接所述处理单元和所述语音获取单元,所述合成单元中预先训练形成一语音合成模型,所述合成单元用于将所述发音文本和所述发音时段信息所述语音合成模型中,以得到对应于所述待模拟语音的合成语音并输出。
7.如权利要求6所述的语音合成系统,其特征在于,所述发音时段信息包括所述基本音子的起始发音时刻和终止发音时刻。
8.如权利要求6所述的语音合成系统,其特征在于,所述语音获取单元具体包括:
第一获取模块,用于获取所述待模拟语音;
第二获取模块,连接所述第一获取模块,用于获取所述待模拟语音的基频信息;
则所述合成单元将所述待模拟语音的所述基频信息作为在所述语音合成模型中进行语音合成时应用的基频信息,以处理得到所述合成语音。
9.如权利要求6所述的语音合成系统,其特征在于,所述合成单元为语音合成器。
10.如权利要求9所述的语音合成系统,其特征在于,于所述语音合成器中预先设置有用于形成预设的音色的合成器参数;
所述合成单元采用所述合成器参数,以所述预设的音色处理得到所述合成语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711080690.6/1.html,转载请声明来源钻瓜专利网。