[发明专利]一种腭裂语音声韵母自动切分方法及系统有效
申请号: | 201610131764.3 | 申请日: | 2016-03-09 |
公开(公告)号: | CN105679332B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 何凌;柳银;尹恒;郭春丽 | 申请(专利权)人: | 四川大学 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G10L25/66;G10L25/93 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 袁春晓 |
地址: | 610064 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 腭裂 语音 声韵 自动 切分 方法 系统 | ||
1.一种腭裂语音声韵母自动切分算法,其特征在于,对包含声母的音节进行以下处理步骤:
准清音声母及准浊音声母判别步骤,用于判别所述音节为包含准清音声母的音节还是包含准浊音声母的音节;
对包含准清音声母的音节进行声韵母切分步骤;
以及对包含准浊音声母的音节进行声韵母切分步骤;
对包含准清音声母的音节进行声韵母切分步骤进一步包括:
步骤Z1:对于所述包含准清音声母的音节的语音信号进行小波变换与短时能量幅值计算得到声韵母切分粗定位点;
步骤Z2:在所述包含准清音声母的音节的语音信号中截取包含声韵母切分粗定位点的一段语音信号,对截取的语音信号进行短时过零率计算,得到声韵母切分精确定位点;
对包含准浊音声母的音节进行声韵母切分步骤进一步包括:
步骤Q1:对所述包含准浊音声母的音节的语音信号进行带通滤波;
步骤Q2:对滤波后的包含准浊音声母的音节的语音信号进行短时自相关函数计算,得到声韵母切分粗定位点;
步骤Q3:在所述滤波后的包含准浊音声母的音节的语音信号中截取包含声韵母切分粗定位点的一段语音信号,进行语音信号时域波形的差异分析,得到声韵母切分精确定位点。
2.根据权利要求1所述的一种腭裂语音声韵母自动切分算法,其特征在于,所述准清音声母及准浊音声母判别步骤进一步包括:
对音节语音信号进行分帧,帧长为20ms,帧移为三分之一帧长;
计算前5帧语音信号的短时过零率;
若所述5帧语音信号中有任一帧的短时过零率超过50,则将该音节判别为包含准清音声母的音节;否则判断为包含准浊音声母的音节。
3.根据权利要求1所述的一种腭裂语音声韵母自动切分算法,其特征在于,
所述步骤Z1进步一包括:
步骤Z11:对所述包含准清音声母的音节的语音信号进行一维小波分解得到低频系数向量与高频系数向量,分解深度为一层;然后将低频系数向量与高频系数向量按位对应相乘并进行归一化,得到小波变换系数向量C;
步骤Z12:将小波变换系数向量C进行分帧,帧间无重叠也无间隔;对于每帧信号xi(k),k=1,2,…,N,计算其短时幅值绝对值和Mi,其计算公式为:i表示为第i帧信号,N为每帧信号的长度;
取短时幅值绝对值和大于阈值T的第一帧信号的起点作为该包含准清音声母的音节的声韵母切分粗定位点;
所述步骤Z2进一步包括:
步骤Z21:设置一窗口W1,使用该窗口W1在所述包含准清音声母的音节的语音信号中截取语音信号S1,其窗口中心为所述声韵母切分粗定位点,窗口宽度为wth1,如果声韵母切分粗定位点距离音节的语音信号的起始点的长度小于wth1×1/2,则取音节的语音信号的起始点为窗口W1的起始点;
步骤Z22:将语音信号S1进行分帧,帧间有重叠;对每帧信号计算短时过零率,得到语音信号S1的短时过零率向量Z;
步骤Z23:对向量Z进行中值滤波,滤波长度为向量Z长度的一半;中值滤波后得到向量L1;
步骤Z24:对向量L1计算一阶微分,得到微分向量D1,微分向量D1中的最小值即对应声韵母切分精确定位帧,该帧的起始点即为声韵母切分精确定位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610131764.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频播放的方法及装置
- 下一篇:一种声气信号分离与合成的方法及系统