[发明专利]基于改进声调核模型的汉语语音声调识别方法无效
| 申请号: | 201310185819.5 | 申请日: | 2013-05-20 |
| 公开(公告)号: | CN103325372A | 公开(公告)日: | 2013-09-25 |
| 发明(设计)人: | 毛峡;魏鹏飞 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G10L17/16 | 分类号: | G10L17/16 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 改进 声调 模型 汉语 语音 识别 方法 | ||
(一)技术领域:
本发明涉及一种基于改进的声调核模型的汉语语音声调识别的方法,属于信息技术领域。
(二)背景技术:
声调识别是语音识别的一项重要研究内容。根据语音激励调制模型,语音信号的产生包括声门激励和声道调制两部分。声门激励决定了语音韵律变化,对语音情感识别具有重要作用。声道调制主要决定了说话内容,每种元音对应不同的共振峰,反映不同的声道形状信息。汉语是有调语音,大部分音节由声母和韵母构成,相同声母和韵母构成的音节随声调的不同具有不同的意义也表达着不同的情感。汉语中的主要声调有4种,包括:阴平,阳平,上声,去声。实际的基频曲线并不是斜率保持不变的标准曲线。不同的基频曲线的开始段称为弯头段,末尾段称为降尾段,而中间一段称为调型段。针对此特点,东京大学的广濑教授提出了声调核模型用于声调识别。他提取基频曲线中最能体现声调变化趋势的调型段作为声调核。但是,该声调核模型忽略了基频曲线中存在的野值,仅将基频曲线划分为过渡段+声调核+过渡段的模式。实际上,由于任何的音节分割算法均无法100%的准确分割有音部分与无音部分,因此,在基频曲线的起始与末尾段存在一些无音段的基频野值,而这些基频野值会导致利用传统的三分段声调核模型提取声调核发生错误。基于此,本发明提出了改进的声调核模型,将完整的基频曲线自适应的划分为I段(I≤5),并从I段中选取声调核,利用声调核的声学特征进行声调识别。
(三)发明内容:
本发明的目的在于提供一种提高汉语孤立音节声调识别率的方法,本发明提出了一种改进的声调核模型,并基于该模型提出了一种自适应的声调核提取的算法。该模型将基频曲线最多划分为5部分,并利用自相关系数判断首尾部分是否为野值段,移除野值段后,对不同分段情况进行声调核提取。通过提取声调核的 声学特征作为特征参数训练隐马尔科夫模型进行识别以提高4种声调的平均识别率。
本发明提出一种基于改进的声调核模型的汉语语音声调识别的方法,其流程图见图1:其中包括以下内容:
首先,提出了一种改进的声调核模型,将孤立音节的基频曲线划分为起始野值段,起始过渡段,声调核,末尾过渡段,末尾野值段五部分;其中起始野值段与末尾野值段属于基频野值,是由于音节分割无法100%准确分离有音部分与无音部分而产生的随机分布的基频值;起始过渡段与末尾过渡段是由复杂的喉部机械生理结构而导致的基频曲线波动,对声调的听辨不起作用;声调核是决定声调类型的关键部分,最能体现声调基频变化的趋势。基于改进的声调核模型的基频曲线分段结构如图2所示,图3展示了一个4声音节的基频曲线。
其次,基于改进的声调核模型,提出了一种自适应提取孤立音节基频曲线声调核的算法,算法流程图如图4所示,具体步骤如下:
步骤一:确立声调核提取应遵循的原则:(1)语音学原则:由于人对音调的时长感知范围在40-60ms,因此声调核的时长应大于50ms,即声调核帧长应大于5帧;(2)统计学原则:对于分割完成的若干部分,若相邻部分的斜率相近,则合并相邻部分;(3)长度原则:为保证计算的自相关系数的有效性,首尾部分的帧长应大于3;
步骤二:利用Viterbi聚类算法将孤立音节的基频曲线分割为5部分,根据改进的声调核模型,首尾为野值段,中间为声调核,其余两部分为过渡段;根据声调核提取准则,判断首尾部分与中间部分的帧长,若其不满足声调核提取准则要求,则进入步骤三,若其满足声调核提取准则要求,则计算首尾部分的自相关系数r,自相关系数,是用于衡量两个变量之间线性关系的量,计算公式如(1)所示,当r大于0.9时则认为两变量具有较强的线性关系。若r的值小于0.9,则移除该部分,进入步骤四,若r的值大于0.9,则保留该部分,进入步骤四;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310185819.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:便捷式引伸计夹持装置
- 下一篇:一种测量动物粪便温室气体排放速率的静态箱





