[发明专利]一种基于元音基频信息的汉语声调识别方法有效
申请号: | 201710900785.1 | 申请日: | 2017-09-28 |
公开(公告)号: | CN107507610B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 晁浩;刘永利;鲁保云;智慧来;宋成;余琼霞 | 申请(专利权)人: | 河南理工大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/18;G10L19/032 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 454000 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于元音基频信息的汉语声调识别方法。该方法包括如下步骤:接收音节对应的语音信号,进行预加重,分帧加窗,并对加窗后的语音信号进行快速傅立叶变换,得到时频域上的能量分布;计算语音信号的低频带能量曲线和中频带能量曲线;计算语音信号的低频带能量随时间的变化率曲线;确定低频能量发生跳变的跳变点,获取语音信号中的浊音段;从浊音段中获取候选元音帧;计算候选元音帧的短时过零率,根据短时过零率确定元音段;计算元音段的基频,并获取声调特征;将声调特征输入到预先训练好的声调模型,得到声调类型。 | ||
搜索关键词: | 一种 基于 元音 基频 信息 汉语 声调 识别 方法 | ||
【主权项】:
一种基于元音基频信息的汉语声调识别方法,其特征在于包括如下步骤:步骤1、接收音节对应的语音信号,对所述语音信号进行预加重,然后分帧加窗,并对加窗后的语音信号进行快速傅立叶变换,得到所述语音信号在时频域上的能量分布;步骤2、根据所述语音信号在时频域上的能量分布计算所述语音信号的低频带能量曲线和中频带能量曲线;步骤3、根据所述语音信号的低频带能量曲线计算所述语音信号的低频带能量随时间的变化率曲线;步骤4、根据所述语音信号的低频带能量随时间的变化率曲线,确定低频能量发生跳变的跳变点,获取所述语音信号中的浊音段;步骤5、根据所述语音信号的低频带能量曲线和中频带能量曲线从所述浊音段中获取候选元音帧;步骤6、计算所述候选元音帧的短时过零率,根据短时过零率确定所述语音信号的元音段;步骤7、计算所述元音段的基频,并根据所述元音段的基频获取声调特征;步骤8、将所述声调特征输入到预先训练好的声调模型,得到声调类型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南理工大学,未经河南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710900785.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种便携式骑车用传话装置
- 下一篇:一种语音分类识别的方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置