[发明专利]一种基于元音基频信息的汉语声调识别方法有效
申请号: | 201710900785.1 | 申请日: | 2017-09-28 |
公开(公告)号: | CN107507610B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 晁浩;刘永利;鲁保云;智慧来;宋成;余琼霞 | 申请(专利权)人: | 河南理工大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/18;G10L19/032 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 454000 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 元音 基频 信息 汉语 声调 识别 方法 | ||
本发明公开了一种基于元音基频信息的汉语声调识别方法。该方法包括如下步骤:接收音节对应的语音信号,进行预加重,分帧加窗,并对加窗后的语音信号进行快速傅立叶变换,得到时频域上的能量分布;计算语音信号的低频带能量曲线和中频带能量曲线;计算语音信号的低频带能量随时间的变化率曲线;确定低频能量发生跳变的跳变点,获取语音信号中的浊音段;从浊音段中获取候选元音帧;计算候选元音帧的短时过零率,根据短时过零率确定元音段;计算元音段的基频,并获取声调特征;将声调特征输入到预先训练好的声调模型,得到声调类型。
技术领域
本发明涉及语音识别领域,特别涉及一种基于元音基频信息的汉语声调识别方法。
背景技术
声调是汉语音节的三要素之一,人们不仅要凭借不同的声母、韵母来辨别字和词的意义,还需要以不同的声调来区分他们。在汉语连续语音识别系统中,如果能获得准确的声调信息将会有效地提高识别系统的性能。
将声调信息应用到连续语音识别系统中时,一种常见的方式是显式的声调建模。显式的声调建模强调根据声调特征,训练独立于声学模型的声调模型。在语音识别过程中,声调模型的概率得分可以在一遍搜索时加入路径的总得分中,也可以对最优的N条路径(N-best)进行重新打分时加入。
声调建模时最常用的特征为音节的基频轮廓信息。由于音节之间存在协同发音现象,同一种声调的基频轮廓也会随着相邻音节的不同发生变化,进而影响声调识别精度。为了消除协同发音的影响,通常将相邻音节的基频信息同当前音节的基频信息一起用于声调识别。但是这种声调建模方法不仅要提取当前音节的基频,还要提取前后相邻音节的基频,计算复杂度较高,用于一遍搜索时会明显降低语音识别的解码速度。
发明内容
本发明的目的在于针对现有技术中的汉语声调方法计算复杂度较高的缺陷,提出一种利用元音基频信息来识别汉语声调的方法,不仅能够消除协同发音现象的影响,还有效地降低了计算复杂度。
本发明公开了一种基于元音基频信息的汉语声调识别方法,其具体包括以下步骤:
步骤1、接收音节对应的语音信号,对所述语音信号进行预加重,然后分帧加窗,并对加窗后的语音信号进行快速傅立叶变换,得到所述语音信号在时频域上的能量分布;
步骤2、根据所述语音信号在时频域上的能量分布计算所述语音信号的低频带能量曲线和中频带能量曲线;
步骤3、根据所述语音信号的低频带能量曲线计算所述语音信号的低频带能量随时间的变化率曲线;
步骤4、根据所述语音信号的低频带能量随时间的变化率曲线,确定低频能量发生跳变的跳变点,获取所述语音信号中的浊音段;
步骤5、根据所述语音信号的低频带能量曲线和中频带能量曲线从所述浊音段中获取候选元音帧;
步骤6、计算所述候选元音帧的短时过零率,根据短时过零率确定所述语音信号的元音段;
步骤7、计算所述元音段的基频,并根据所述元音段的基频获取声调特征;
步骤8、将所述声调特征输入到预先训练好的声调模型,得到声调类型。
上述技术方案中,步骤1-6检测出当前音节的元音段,步骤7中只提取当前音节中元音段的基频信息,然后利用元音段的基频信息识别声调类型。由于音节中的元音一般位于音节的中央位置,其基频轮廓受前后音节声调类型的影响较小,所以上述技术方案能够有效地消除声调识别时协同发音现象带来的不利影响。此外,由于只计算当前音节中元音的基频,所以还能有效地降低了计算复杂度。
附图说明
图1是根据本发明的一种基于元音基频信息的汉语声调识别方法的流程图;
图2是根据本发明的一个计算语音信号的低频带能量曲线和中频带能量曲线的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南理工大学,未经河南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710900785.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便携式骑车用传话装置
- 下一篇:一种语音分类识别的方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置