[发明专利]基于特征转换规则的汉语耳语音向自然语音实时转换方法无效
| 申请号: | 200810181483.4 | 申请日: | 2008-11-11 |
| 公开(公告)号: | CN101441868A | 公开(公告)日: | 2009-05-27 |
| 发明(设计)人: | 陈雪勤;赵鹤鸣 | 申请(专利权)人: | 苏州大学 |
| 主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/02 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 215123江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特征 转换规则 汉语 耳语 自然 语音 实时 转换 方法 | ||
1.一种汉语耳语音向自然语音实时转换的方法,其特征在于:该方法包括以下阶段,
耳语音信号的预处理阶段,该阶段对耳语音信号先后进行端点检测处理和声韵分割处理;
耳语音信号的特征分析及提取阶段,其中所述特征分析及提取包括激励特征的分析及提取和声道特征的分析及提取,该阶段对耳语音信号的预处理阶段得到的结果分别进行激励特征提取操作和声道特征提取操作,并采取声调与基频估计方法将激励特征提取操作提取的激励信息转换产生基频信息,以及采取声道参数转换规则将声道特征提取操作提取的声道信息转换产生自然语音声道信息;
语音合成阶段,耳语音信号的特征分析及提取阶段最终获取的基频信息和自然语音声道信息在该阶段进行语音合成而产生相应的自然语音信号,从而实现耳语音向自然语音的实时转换,
所述采取声道参数转换规则将声道特征提取操作提取的声道信息转换产生自然语音声道信息的具体过程为,
设声道模型的系统函数为 其中P为线性预测阶数,ai,i=1~P是P阶LPC系数;
系统的线谱频率参数用ωi表示为0<ω1<ω2<…<ωP<π,耳语音与正常音的线谱频率参数的映射关系用如下反正切关系表示:
μ=λ·tan-1([1:P])
μ_m=max(μ)
从而将线谱频率参数调整为
ω′=ω·ζ
其中,ω′为调整后的正常音的线谱频率参数,参数ω为ω1,ω2,…ωP,ω′为ω1′,ω2′...ωP′,参数λ为非线性放大加权系数,近似反映耳语音与自然语音的声道特征变化率,用于确定系统的线谱频率参数ωi的非线性调整幅度,λ取值范围为0.85≤λ≤0.95,
调整后的线谱频率参数遵循由小到大的规则,并且0<ω′1<ω′2<…<ω′P<π以使系统稳定。
2.根据权利要求1所述的汉语耳语音向自然语音实时转换的方法,其特征在于:在上述耳语音信号的特征分析及提取阶段所采取的声调与基频估计方法包括以下步骤,
步骤(1),分析激励信息的声调及性别特征;
步骤(2),在判断出说话人声调之后,采用用于拟合汉语四声声调曲线的多项式曲线混合模型建立一个合适的声调模型,所述多项式曲线混合模型表示为
f1(t)=-(a11t+b11)4+0.01×(a12t+b12)2+b13
f2(t)=-8×(a21t+b21)6+(a22t+b22)2+b23
f3(t)=3×(-10×(a31t+b31)6+(a32t+b32)2)+b33
f4(t)=-5×(a41t+b41)4-0.5×(a42t+b42)+b43
其中,t表示归一化的时间,可通过对参数a11、a12、a21、a22、a31、a32、a41、a42、 b11、b12、b21、b22、b31、b32、b41、b42、b13、b23、b33、b43进行适当设定以选择声调曲线形状,
进一步根据所知的基准音高对归一化的该声调曲线进行相应的尺度放大和频率提升以满足不同性别说话人和不同语气语调情况下的声调特点,从而将激励特征提取操作提取的激励信息转换产生声调基频信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810181483.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:曝光头和图像形成装置
- 下一篇:平移式硫化机





