[发明专利]一种基于DTW的孤立词语音识别方法在审
申请号: | 201710264774.9 | 申请日: | 2017-04-21 |
公开(公告)号: | CN107039037A | 公开(公告)日: | 2017-08-11 |
发明(设计)人: | 邓立新;周炳良;洪民江 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L15/12 | 分类号: | G10L15/12;G10L15/06;G10L15/02 |
代理公司: | 江苏爱信律师事务所32241 | 代理人: | 赵赞赞 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dtw 孤立 词语 识别 方法 | ||
1.一种基于DTW的孤立词语音识别方法,基于传统的语音训练模式,改进了语音识别阶段,其特征在于,先截取测试语音特征矢量的起始部分长度,并从起点开始搜索它们与各个模板矢量的最优匹配路径,采用松弛端点检测的方法找到最优匹配路径的止点并求出各自的最小累积距离D,即找出各模板矢量与截取语音特征矢量匹配度最大的起始部分长度并求出相应的D,然后选择D相对较小的部分模板保留下来,排除掉D相对较大的模板;如此循环采用这种方法对剩余的模板进行部分长度匹配和排除,直至剩余模板数量唯一。
2.如权要求1所述的方法,其特征在于,识别阶段具体步骤如下:
步骤1:将通过训练得到语音训练模板存入内存,总数记为c,同时进行识别阶段预设工作,设置测试语音特征矢量的截取方式,包括截取次数m和各次截取长度a1,a2…am即百分比;设置各次最优路径匹配后训练模板的保留个数b1,b2…bm-1,百分比且最后一次取一个模板,bm可忽略;
步骤2:利用测试语音特征矢量与训练模板矢量最优匹配路径的全局限制条件,排除部分训练模板,保留满足条件的训练模板;条件公式如下:
其中N为测试语音特征矢量长度,M为训练模板矢量长度;
步骤3:记保存测试语音特征矢量与某一保留训练模板矢量帧匹配失真度矩阵为d和累积失真度矩阵为D=Realmax,其中d和D的大小均为N*M且横向表示测试语音帧,纵向表示训练模板帧。计算测试语音特征矢量第一帧与上述训练模板矢量第一帧的帧失真度,并保存到d(1,1)和D(1,1)中;同理,计算测试语音特征矢量第一帧与所有保留训练模板矢量第一帧的帧失真度,并分别保存到各自的帧失真度矩阵d与累积失真度矩阵D相同的位置;
步骤4:满足图4全局路径限制,搜索出训练模板矢量中与测试语音特征矢量第s-f帧相交的帧,其中四舍五入取整,n为截取迭代次数,初值n=1且a0=0;
步骤5:计算搜索到的相交帧的帧失真度,并利用如下公式递推相交帧的累积失真度,分别保存到d与D相应的位置,其中累积失真度公式满足图5的局部路径限制方式;累积失真度公式:
D(x,y)=d(T(x),R(y))+min{D(x-1,y),D(x-1,y-1),D(x-1,y-2)}
其中T(x)为测试语音特征矢量第x帧,R(y)为训练模板矢量第y帧;
步骤6:搜索累积失真度矩阵f列中最小的值,记为该训练模板矢量与测试语音特征矢量部分匹配失真度Dmin;
步骤7:利用步骤4~6,计算并搜索出测试语音特征矢量与所有保留训练模板矢量的部分匹配失真度Dmin。将所有训练模板矢量按照得到的Dmin进行从小到大排序,保留排序前c*bn个模板,,四舍五入取整;
步骤8:判决c*bn>1?
若是,则转入步骤9执行;
若否,则转入步骤10执行;
步骤9:检测n<m?
若是,则截取迭代次数n=n+1,转入步骤4执行;
若否,则转入步骤10执行;
步骤10:将步骤7中已排序的训练模板矢量中的第一个训练模板矢量表示的语音判决为测试语音,结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710264774.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:山楂中安赛蜜的残留量的测定方法
- 下一篇:一种水质监测系统