[发明专利]语音分析设备、语音分析方法和语音分析程序无效
申请号: | 200510051030.6 | 申请日: | 2005-02-25 |
公开(公告)号: | CN1661675A | 公开(公告)日: | 2005-08-31 |
发明(设计)人: | 工藤裕一 | 申请(专利权)人: | 世嘉股份有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/04;G10L17/00;G06T13/00 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 黄纶伟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了一种语音分析方法和设备,由此能够实时地执行处理,并能够应付无限制数量的说话者。一种计算机可执行的语音分析方法从输入语音中检测音素边界,并且特征在于重复在输入语音信号中指定时刻的步骤、提取从该时刻开始的规定长度的时间范围中包含的语音信号的步骤、以及将所提取的语音信号分解成频率分量数据的步骤;从规定长度的时间范围中包含的语音信号中求得多个频率分量数据;使用与规定长度的相邻时间范围中包含的语音信号相对应的频率分量数据求得多个相关度;求得变化度大于相邻的两个变化度的时间范围;以及,根据这些时间范围将输入的语音信号划分成多个片段。 | ||
搜索关键词: | 语音 分析 设备 方法 程序 | ||
【主权项】:
1.一种计算机可执行的语音分析方法,从输入语音中检测音素边界,包括:在所述输入语音信号中指定时刻的第一步;提取从所述时刻开始的规定长度的时间范围中包含的语音信号的第二步;和将所述提取的语音信号分解成频率分量数据的第三步,其中通过在每个规定时间中重复所述第一、第二和第三步n次(其中n是至少为6的自然数),求得从n个所述规定长度的时间范围中包含的语音信号中提取出的n个频率分量数据;通过根据与相互邻接的所述规定长度的时间范围中包含的所述语音信号相对应的第i项所述频率分量数据和第(i+1)项所述频率分量数据求得第i个相关度(其中i是至少为1且不大于(n-1)的自然数),从而由n个所述频率分量数据求得(n-1)个相关度;通过根据第k个相关度和所述第(k+1)个所述相关度(其中k是至少为1且不大于(n-2)的自然数)求得第k个变化度,从而由(n-1)个所述的相关度求得(n-2)个所述的变化度;当将m限定为指定在从第1至第(n-2)的(n-2)个变化度中大于与所指定的变化度相邻的两个变化度的变化度的编号时,即m满足条件:当m从2到(n-3)每次变化1时,第m个变化度大于第(m-1)个变化度,并大于第(m+1)个变化度,求得所限定的数m;根据所限定的数m指定所述规定长度的时间范围;并且根据所述指定的时间范围将所述输入语音信号划分成多个片段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世嘉股份有限公司,未经世嘉股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200510051030.6/,转载请声明来源钻瓜专利网。