[发明专利]基于特征转换规则的汉语耳语音向自然语音实时转换方法无效
| 申请号: | 200810181483.4 | 申请日: | 2008-11-11 |
| 公开(公告)号: | CN101441868A | 公开(公告)日: | 2009-05-27 |
| 发明(设计)人: | 陈雪勤;赵鹤鸣 | 申请(专利权)人: | 苏州大学 |
| 主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/02 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 215123江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特征 转换规则 汉语 耳语 自然 语音 实时 转换 方法 | ||
技术领域
本发明涉及语音转换技术领域和通信技术领域,特别地,涉及一种基于特征转换规则的汉语耳语音向自然语音实时转换方法。
背景技术
耳语音是人们在某种特定场合下为了避免影响他人或为了保密而采取的一种通讯方式。在日常生活中耳语是常见的,例如在办公室用手机通话,国家安全部门工作的需要等。关于耳语音的特征分析、识别、重建长期以来受到部分学者的关注,而此类各项研究的主要目标则是根据耳语音恢复相应的自然语音。
从相关的研究报道来看,依据耳语音的信息用人工智能方法产生相应自然语音的方案主要有两种,一种是识别,另一种是重建。
识别法需要建立耳语音和自然语音两个语料库,通过选取能够反映各个耳语音差异的特征,选用合适的识别模型进行训练和识别,根据识别结果从相应的自然语音的数据库中提出该耳语音所对应的自然音。识别法在针对特定人的语料库中,可得到与说话人完全吻合的自然语音,可懂度和听觉舒适度勿庸质疑,但是在非特定人的场合下,往往在能保证语义的条件下说话人的信息得不到保证。该方法需要较大数据量的训练,对未参加识别的语音样本其识别率会明显降低。
南京大学的栗学丽采用MELP模型将汉语耳语音转换为自然音,侧重于讨论耳语音与自然语音的特征之间的差别。其存在的问题主要在于其一方面忽略了声调模型对于合成语音的重要性,另一方面采用线性方法将耳语音的声道参数向正常语音参数的转换,而影响了合成语音的质量。美国的Morris讨论了英语耳语音的重建和识别。由于英语为非声调语言Morris对于激励信息则相对忽略,而着重强调声道信息对于合成语音的重要性,建立共振峰频率和带宽与线谱频率之间的函数关系,根据耳语音与自然语音的共振峰频率和带宽的变化量来调整线谱频率参数。该方案计算量大,不易实现实时转换。
发明内容
本发明的目的在于提供一种汉语耳语音向自然语音实时转换方法,通过对汉语耳语音和相应自然音的分析比较,总结出两种语音的各个特征参数之间的区别和联系,通过对特征参数之间的转换机理的研究,采取经验模态方案取得相应的自然音的特征值,采用基于共振峰的语音合成器,并对重建后的语音进行主客观评价,从而弥补现有技术的不足。
本发明提供一种汉语耳语音向自然语音实时转换的方法,该方法包括以下阶段,耳语音信号的预处理阶段,该阶段对耳语音信号先后进行端点检测处理和声韵分割处理;耳语音信号的特征分析及提取阶段,其中所述特征分析及提取包括激励特征的分析及提取和声道特征的分析及提取,该阶段对耳语音信号的预处理阶段得到的结果分别进行激励特征提取操作和声道特征提取操作,并采取声调模型与基频估计方法将激励特征提取操作提取的激励信息转换产生基频信息,以及采取声道参数转换规则将声道特征提取操作提取的声道信息转换产生自然语音声道信息;语音合成阶段,耳语音信号的特征分析及提取阶段最终获取的基频信息和自然语音声道信息在该阶段进行语音合成而产生相应的自然语音信号,从而实现耳语音向自然语音的实时转换,所述采取声道参数转换规则将声道特征提取操作提取的声道信息转换产生自然语音声道信息具体过程为,设声道模型的系统函数为其中P为线性预测阶数,ai,i=1~P是P阶LPC系数;系统的线谱频率参数用ωi表示为0<ω1<ω2<…<ωP<π,耳语音与正常音的线谱频率参数的映射关系用如下反正切关系表示:μ=λ·tan-1([1:P])μ_m=max(μ)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810181483.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:曝光头和图像形成装置
- 下一篇:平移式硫化机





