[发明专利]用于语音识别的音素签名候选有效
| 申请号: | 201410487689.5 | 申请日: | 2014-09-22 |
| 公开(公告)号: | CN104732971B | 公开(公告)日: | 2019-07-30 |
| 发明(设计)人: | K.彻克特 | 申请(专利权)人: | SAP欧洲公司 |
| 主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/28 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽;张婧 |
| 地址: | 德国瓦*** | 国省代码: | 德国;DE |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 语音 识别 音素 签名 候选 | ||
1.一种有形地存储指令的非临时性计算机可读存储介质,当该指令由计算机运行时使得计算机执行操作,所述操作包括:
在计算设备处确定语音信号的基础频率f0,其中所述语音信号被认为是平曲线,其中所述语音信号包括极值点,所述语音信号在该极值点处改变方向导致在每个极值点处的曲率;
其中所述语音信号表示为随一段时间t的气压值,并且其中作为所述语音信号的一部分的音素由音素函数p(t)表示,其表示随时间的该气压;
基于归一化的音素函数计算所述语音信号的极值点处的曲率,其中,所述归一化的音素函数是按照下式的音素函数p(t)的时间周期T=1/f0和音素函数p(t)的值max(|pmin|,|pmax|)的函数:
其中音素函数p(t)的值max(|pmin|,|pmax|)是音素函数p(t)的最大值pmax的绝对值和音素函数p(t)的最小值pmin的绝对值中更大的值;
其中通过下式来执行在所述极值点处的所述曲率的计算:
将计算出的曲率与音素的基准曲率进行比较;以及
当计算出的曲率的序列与基准曲率的序列相匹配时,鉴别相应的音素。
2.如权利要求1所述的计算机可读存储介质,包括指令,当该指令由计算机运行时使得计算机执行操作,所述操作还包括:
将语音信号划分为帧;以及
将语音信号的极值点的坐标与音素的基准坐标进行比较;以及
鉴别相应的音素,包括:
当计算出的曲率的序列与基准曲率的序列相匹配、而且与计算出的曲率的序列相对应的语音信号的极值点的坐标与一组基准坐标相匹配时,鉴别相应的音素。
3.如权利要求1或2所述的计算机可读存储介质,其中:
所述音素的基准曲率和所述音素的基准坐标存储在所述设备中;或者
所述音素的基准曲率和所述音素的基准坐标存储在可通过网络访问的远程系统中。
4.如权利要求1所述的计算机可读存储介质,其中,响应于在计算设备处接收到声音输入,确定语音信号的基础频率。
5.一种用于音素鉴别的计算机实现方法,该方法包括:
在计算设备处确定语音信号的基础频率f0,其中所述语音信号被认为是平曲线,其中所述语音信号包括极值点,所述语音信号在该极值点处改变方向导致在每个极值点处的曲率;
其中所述语音信号表示为随一段时间t的气压值,并且其中作为所述语音信号的一部分的音素由音素函数p(t)表示,其表示随时间的该气压;
基于归一化的音素函数计算所述语音信号的极值点处的曲率,其中,所述归一化的音素函数是按照下式的音素函数p(t)的时间周期T=1/f0和音素函数p(t)的值max(|pmin|,|pmax|)的函数;
其中音素函数p(t)的值max(|pmin|,|pmax|)是音素函数p(t)的最大值pmax的绝对值和音素函数p(t)的最小值pmin的绝对值中更大的值;
其中通过下式来执行在所述极值点处的所述曲率的计算:
将计算出的曲率与音素的基准曲率进行比较;以及
当计算出的曲率的序列与基准曲率的序列相匹配时,鉴别相应的音素。
6.如权利要求5所述的方法,还包括:
将语音信号划分为帧;以及
将语音信号的极值点的坐标与音素的基准坐标进行比较;以及
鉴别相应的音素,包括:
当计算出的曲率的序列与基准曲率的序列相匹配、而且与计算出的曲率的序列相对应的语音信号的极值点的坐标与一组基准坐标相匹配时,鉴别相应的音素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP欧洲公司,未经SAP欧洲公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410487689.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于分组统计的HMM声纹识别签到方法及系统
- 下一篇:带笛头十孔管





