[发明专利]基于先验清浊知识的基频提取方法及系统有效
申请号: | 201010233627.3 | 申请日: | 2010-07-22 |
公开(公告)号: | CN102339605A | 公开(公告)日: | 2012-02-01 |
发明(设计)人: | 王玉平 | 申请(专利权)人: | 盛乐信息技术(上海)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/14;G10L11/06 |
代理公司: | 上海浦一知识产权代理有限公司 31211 | 代理人: | 王函 |
地址: | 201203 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 先验 清浊 知识 基频 提取 方法 系统 | ||
技术领域
本发明属于一种语音信号处理方法,尤其涉及一种基频提取方法;具体涉及一种基于先验清浊知识的基频提取方法;此外,本发明还涉及一种基于先验清浊知识的基频提取系统。
背景技术
在当前的中文语音信号处理中,经常会碰到需要提取基频参数的情况,而现在许多的基频提取算法,在清浊判决的时候或多或少存在问题,特别是在待处理语音的发音不是很饱满、发音比较低沉的情况下,清浊判决的错误率很高,常常导致后面的相关处理受到很大的影响。
在当前的语音合成的研究中,参数化的语音合成算法已被证明可以获得高质量的稳定的合成语音,但是基频提取的好坏能对最终的合成效果产生直接的影响,基频提取的好坏,很大程度上影响着合成语音的质量。
同样,在语音识别和语音评测中,基频的重要性也越来越高,基频参数提取的好坏会对最终结果产生直接的影响。
现有的绝大多数基频提取算法,首先根据输入的语音数据统计相关的统计量,如自相关系数等,然后根据相关的统计量分布来做清浊判决,最后根据清浊判决结果结合相关统计量做基频轨迹平滑,最后输出基频。现有绝大多数基频提取算法的清浊判决模块都是基于数据统计的,由于人类发音的多样性,统计数据并不能很好的处理所有的发音情况。
发明内容
本发明要解决的技术问题是提供一种基于先验清浊知识的基频提取方法,该方法利用清浊切分边界作为先验知识输入到基频提取算法中的清浊判决模块来辅助清浊判决,将原先的自动清浊判决和现有的清浊切分边界融合,就可以得到理想的清浊判决结果,从而提高清浊判决的正确率。为此,本发明还提供一种基于先验清浊知识的基频提取系统。
为解决上述技术问题,本发明一种基于先验清浊知识的基频提取方法,包括如下步骤:
第一步,获取清浊切分边界;
第二步,对待提取数据进行统计量计算;
第三步,将第二步获得的统计量和对应的第一步获得的清浊切分边界结合进行清浊判决;
第四步,动态规划与基频轨迹平滑;
第五步,输出高质量的基频提取结果。
第一步具体包括如下步骤:
步骤1,选取训练数据中的一小部分来做人工标注切分,标注出每个音素的边界作为下个模块的输入;
步骤2,基频及相关参数提取;
步骤3,模型训练;
步骤4,音素切分:利用统计模型和训练数据的参数来进行切分;
步骤5,将音素切分的结果转化为清浊切分边界。
在第一步的步骤1中,所述训练数据表示用于相关语音算法的语音数据,此数据的数据量规模巨大;所述相关语音算法是语音合成、语音识别或语音评测。
在第一步的步骤2中,所述基频提取采用第二步至第五步的基频提取算法,所述相关参数是频谱参数。
在第一步的步骤3中,所述模型训练用于统计参数的分布情况。
在第一步的步骤4中,先对所有训练数据进行参数分析,该步骤对于基频参数采用传统的基频提取算法。
在第二步中,所述待提取数据指需要进行基频提取的训练数据;所述统计量计算指根据输入的语音信号分帧来计算每帧数据的统计量。
此外,本发明还提供一种基于先验清浊知识的基频提取系统,包括统计量计算模块、动态规划与基频平滑模块、清浊判决模块和清浊切分边界获取模块;该统计量计算模块用于待提取的训练数据进行统计量计算;该清浊判决模块用于将统计量计算模块获得的统计量和清浊切分边界获取模块获得的对应的清浊切分边界结合进行清浊判决;该动态规划与基频平滑模块用于对清浊判决模块的数据进行动态规划以获得平滑的基频轨迹,并输出基频提取结果。
所述清浊切分边界获取模块包括少量人工标注模块、基频及相关参数提取模块、模型训练模块和音素切分模块;该少量人工标注模块用于选取训练数据中的一小部分来做人工标注切分,标注出每个音素的边界作为基频及相关参数提取模块的输入;该模型训练模块用于对基频及相关参数提取模块提取的参数进行统计分布情况;该音素切分模块利用模型训练模块统计的参数来进行切分,并将音素切分的结果转化为清浊切分边界。
所述音素切分模块对所有训练数据进行参数分析,该模块对于基频参数采用传统的基频提取算法。
所述统计量计算模块根据输入的语音信号分帧来计算每帧数据的统计量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盛乐信息技术(上海)有限公司,未经盛乐信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010233627.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种金属管喷漆装置
- 下一篇:半导体集成器件制造方法