[发明专利]基于HMM的情感语音合成方法、装置及存储介质在审
| 申请号: | 201910222805.3 | 申请日: | 2019-03-22 |
| 公开(公告)号: | CN109949791A | 公开(公告)日: | 2019-06-28 |
| 发明(设计)人: | 彭俊清;尚迪雅;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L13/027 | 分类号: | G10L13/027;G10L13/10;G10L25/03;G10L25/27;G06F17/27 |
| 代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 李玉琦;张超艳 |
| 地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 合成文本 语音参数 合成 情感语音 上下文属性 标注信息 存储介质 声学参数 训练语音 状态序列 人工智能技术 电子装置 情感信息 文本分析 语料库 构建 语音 | ||
1.一种基于HMM的情感语音合成方法,应用于电子装置,其特征在于,包括:
提取语料库中训练语音的声学参数;
构建HMM;
利用所述声学参数训练所述HMM,得到训练后的HMM;
通过对待合成文本进行文本分析处理,得到所述待合成文本的上下文属性和标注信息;
根据所述上下文属性和标注信息得到相应的状态序列;
根据所述状态序列和训练后的HMM生成待合成文本的语音参数;
将所述待合成文本的语音参数合成得到目标情感语音。
2.根据权利要求1所述的基于HMM的情感语音合成方法,其特征在于,对待合成文本进行文本分析处理,包括:
对待合成文本进行规范化处理;
通过分析经过规范化处理的文本中的特殊符号、韵律短语的读音方式及文本字符的边界,确定文本的结构、组成以及标点符号出现的位置;
根据文本的结构、组成以及标点符号出现的位置,确定发音时语气的表达方式,并标注重音位置。
3.根据权利要求1所述的基于HMM的情感语音合成方法,其特征在于,根据所述上下文属性和标注信息得到相应的状态序列,包括:根据所述上下文属性和标注信息,通过在聚类决策树上进行决策,得到相应的状态序列。
4.根据权利要求1所述的基于HMM的情感语音合成方法,其特征在于,根据所述状态序列和训练后的HMM生成待合成文本的语音参数,包括:
根据所述状态序列得到基元各个状态的持续时长,其中,所述基元包括词、音节、半音节、声韵母和音素;
通过训练后的HMM获取基音周期和频谱参数;
根据所述持续时长、所述基音周期和所述频谱参数生成语音参数。
5.根据权利要求1所述的基于HMM的情感语音合成方法,其特征在于,所述训练语音的声学参数包括基频参数,提取语料库中训练语音的基频参数的步骤包括:
对待提取的训练语音进行预处理;
计算经过预处理之后的训练语音的短时自相关函数,并选取所述短时自相关函数的局部最大点;
将出现第一个所述局部最大点的时间点作为所述训练语音的基音周期;
通过计算所述基音周期的倒数得到所述训练语音的基频参数。
6.根据权利要求5所述的基于HMM的情感语音合成方法,其特征在于,所述短时自相关函数通过下式得到:
Ra(k)=∑x(n)x(n-k)
式中,Ra(k)表示短时自相关函数,n表示时刻,k表示时间的延迟量,x(n)表示语音信号,a表示窗函数是从第a个样点开始加入。
7.根据权利要求1所述的基于HMM的情感语音合成方法,其特征在于,所述训练语音的声学参数包括短时能量,提取语料库中训练语音的短时能量包括:通过下式得到语音信号的短时能量,
其中,n表示为第n时刻,m表示时间,x(m)表示语音信号,w表示权值,En表示短时能量。
8.根据权利要求1至7中任一项所述的基于HMM的情感语音合成方法,其特征在于,训练所述HMM,包括:对语料库中的训练语音进行标注,根据标注信息和提取的声学参数,在上下文属性和问题集的指导下,进行HMM的训练。
9.一种电子装置,其特征在于,该电子装置包括:处理器;存储器,所述存储器中包括基于HMM的情感语音合成程序,所述基于HMM的情感语音合成程序被所述处理器执行时实现如权利要求1至8中任一项所述的基于HMM的情感语音合成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括基于HMM的情感语音合成程序,所述基于HMM的情感语音合成程序被处理器执行时,实现如权利要求1至8中任一项所述的基于HMM的情感语音合成方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910222805.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:前馈式室内主动降噪系统
- 下一篇:多音频的合成方法及装置





