[发明专利]一种基于元音基频信息的汉语声调识别方法有效
申请号: | 201710900785.1 | 申请日: | 2017-09-28 |
公开(公告)号: | CN107507610B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 晁浩;刘永利;鲁保云;智慧来;宋成;余琼霞 | 申请(专利权)人: | 河南理工大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/18;G10L19/032 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 454000 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 元音 基频 信息 汉语 声调 识别 方法 | ||
1.一种基于元音基频信息的汉语声调识别方法,其特征在于包括如下步骤:
步骤1、接收音节对应的语音信号,对所述语音信号进行预加重,然后分帧加窗,并对加窗后的语音信号进行快速傅立叶变换,得到所述语音信号在时频域上的能量分布;
步骤2、根据所述语音信号在时频域上的能量分布计算所述语音信号的低频带能量曲线和中频带能量曲线;
步骤3、根据所述语音信号的低频带能量曲线计算所述语音信号的低频带能量随时间的变化率曲线;
步骤4、根据所述语音信号的低频带能量随时间的变化率曲线,确定低频能量发生跳变的跳变点,获取所述语音信号中的浊音段;
步骤5、根据所述语音信号的低频带能量曲线和中频带能量曲线从所述浊音段中获取候选元音帧;
步骤6、计算所述候选元音帧的短时过零率,根据短时过零率确定所述语音信号的元音段;
步骤7、计算所述元音段的基频,并根据所述元音段的基频获取声调特征;
步骤8、将所述声调特征输入到预先训练好的声调模型,得到声调类型;
所述步骤2中,根据所述语音信号在时频域上的能量分布计算所述语音信号的低频带能量曲线和中频带能量曲线,具体步骤包括:
步骤21、计算每一帧第i个频率点上能量的贡献度ki,具体通过如下公式获取:
其中,F表示采样频率,N表示帧长;
步骤22、计算每一帧的初始低频带能量和初始中频带能量,其中,所述初始低频带能量通过如下公式获取:
所述初始中频带能量通过如下公式获取:
其中,elow(t)表示第t帧的初始低频带能量,emid(t)表示第t帧的初始中频带能量,pi(t)表示第t帧中第i个频率点上的能量,B1表示低频带和中频带的分界点,B2表示中频带和高频带的分界点;
步骤23、采用当前帧前后特定时间范围内的信号对当前帧能量进行平滑,得到平滑后的低频带能量曲线Elow(t)和中频带能量曲线Emid(t),具体通过如下公式获取:
其中,elow(t+t0)表示第t+t0帧的初始低频带能量,emid(t+t0)表示第t+t0帧的初始中频带能量,M表示平滑时采用的当前帧前后的语音帧数量;
所述步骤3中,计算所述语音信号的低频带能量随时间的变化率曲线,具体通过如下公式得到:
其中,ΔElow(t)表示语音信号的低频带能量随时间的变化率曲线,t表示帧的序号,Len表示时间范围阈值,abs()表示取绝对值;
所述步骤2中,所述低频带是0~0.8kHz,所述中频带是0.8~4kHz;
所述步骤8中,所述预先训练好的声调模型为支持向量机。
2.根据权利要求1所述的基于元音基频信息的汉语声调识别方法,其特征在于,步骤4具体包括:
步骤41、根据所述语音信号的低频带能量随时间的变化率曲线ΔElow(t),在所述语音信号的前半部分选择低频带能量变化率最高的语音帧作为正向跳变点;
步骤42、根据所述语音信号的低频带能量随时间的变化率曲线ΔElow(t),在所述语音信号的后半部分选择低频带能量变化率最高的语音帧作为负向跳变点;
步骤43、选择所述正向跳变点与所述负向跳变点之间的语音段作为语音信号中的浊音段。
3.根据权利要求2所述的基于元音基频信息的汉语声调识别方法,其特征在于,步骤5具体包括:
步骤51、计算所述浊音段中每一帧的分频带能量比,其中所述每一帧的分频带能量比具体通过如下公式得到:
R(t)表示第t帧的分频带能量比;
步骤52、选择分频带能量比超过一定阈值的帧作为候选元音帧。
4.根据权利要求3所述的基于元音基频信息的汉语声调识别方法,其特征在于,步骤6中,所述根据短时过零率确定所述语音信号的元音段,具体为:保留短时过零率大于特定阈值的候选元音帧,形成所述语音信号的元音段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南理工大学,未经河南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710900785.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便携式骑车用传话装置
- 下一篇:一种语音分类识别的方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置