[发明专利]一种基于双层声学模型的快速语音识别方法在审

申请号：	202011095528.3	申请日：	2020-10-14
公开（公告）号：	CN112233659A	公开（公告）日：	2021-01-15
发明（设计）人：	吕勇	申请（专利权）人：	河海大学
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/08;G10L15/26;G10L19/00;G10L25/24
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	王恒静
地址：	210024 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于双层声学模型快速语音识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种基于双层声学模型的快速语音识别方法，在训练阶段用共振峰聚类方法将语音识别系统的全部音节划分为若干类，为语音识别系统同时配置类声学模型和音节声学模型；在识别阶段，先对测试语音进行类识别，确定其类信息，再根据类信息对测试语音进行类内音节识别。本发明可以减小声学解码的计算量，节省手持设备的电能，延长其电池的使用时间。

技术领域

本发明属于语音识别技术领域，具体涉及到一种基于双层声学模型的快速语音识别方法。

背景技术

在传统的语音识别系统中，需要在训练阶段为语音的每个音节建立声学模型；在识别阶段，用每个音节的声学模型计算当前语音特征参数的概率，并比较概率大小，以概率最大的声学模型对应的音节为识别结果。随着语音识别系统词汇量的增加，识别阶段的运算量也随之增加，这会影响语音识别在手持设备等运算性能较差的设备中的应用。

发明内容

发明目的：针对现有技术中存在的问题，本发明提供一种基于低频音节识别的语音增强方法，解决了语音增强后语音音质差的问题。

技术方案：本发明提供一种基于双层声学模型的快速语音识别方法，包括训练阶段和识别阶段，其中，训练阶段包括：

(1)对训练语音文本进行预处理；

(2)用共振峰聚类的方法将语音识别系统的全部音节划分为若干类；

(3)用每一类的所有音节的训练语音进行模型训练，生成类声学模型；

(4)用每个音节的训练语音进行模型训练，生成该音节的声学模型；

识别阶段包括：

(5)对测试语音文本进行预处理；

(6)用类声学模型对当前测试语音的特征向量进行类解码，将其归为某一类语音；

(7)根据类解码得到的类信息，调用该类所有音节的声学模型，对当前语音的特征向量进行音节解码，得到识别结果。

进一步的，包括：