[发明专利]优化语音识别声学模型的方法、系统、设备及存储介质有效

申请号：	201810146221.8	申请日：	2018-02-12
公开（公告）号：	CN108389577B	公开（公告）日：	2019-05-31
发明（设计）人：	雷延强	申请（专利权）人：	广州视源电子科技股份有限公司
主分类号：	G10L15/06	分类号：	G10L15/06
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	510530 广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本标注声学模型样本语音存储介质错误标注语音识别优化比对结果决策条件信息对应比对更新匹配
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了优化语音识别声学模型的方法、系统、设备及存储介质。该方法包括：获取样本语音的标注文本，并获取样本语音基于当前声学模型得到的识别文本；比对标注文本和所述识别文本，并在比对结果为不匹配时确定标注文本相对所述识别文本的错误标注信息；根据所述错误标注信息对应的文本更新决策条件，更新所述样本语音的标注文本；基于设定量的样本语音及当前分别对应的标注文本，重新训练优化所述当前声学模型。利用该方法，能够有效提高样本语音所对应标注文本的标注质量，从而达到了优化声学模型的目的。

技术领域

本发明涉及计算机技术领域，尤其涉及优化语音识别声学模型的方法、系统、设备及存储介质。

背景技术

随着语音识别可应用范围的不断扩大，语音识别技术已成为一个新兴高技术产业，并得到更多技术人员的关注。目前，语音识别系统中的重要组成之一就是声学模型，声学模型的好坏很大程度上决定了语音识别结果的优劣，因此，需要不断对语音识别声学模型进行优化。

一般地，对声学模型的训练需要大量的样本数据支持，而样本数据往往包括语音数据及对应于语音数据的标注文本(语音数据包含的文字内容)。标注文本通常基于大量人工标注实现或通过第三方识别系统识别获得，但通过上述方法获得标注文本往往存在一定错误，影响标注质量。

对于语音识别声学模型而言，提升标注文本的标注质量相当于进行声学模型优化的其中一种手段，但是目前尚未发现通过提升标注文本质量来实现声学模型优化的技术方案。

发明内容

本发明实施例提供了优化语音识别声学模型的方法、系统、设备及存储介质，能够实现标注文本标注质量的提升，从而达到优化声学模型的目的。

第一方面，本发明实施例提供了一种优化语音识别声学模型的方法，包括：

获取样本语音的标注文本，并获取所述样本语音基于当前声学模型得到的识别文本；

比对所述标注文本和所述识别文本，并在比对结果为不匹配时确定所述标注文本相对所述识别文本的错误标注信息；

根据所述错误标注信息对应的文本更新决策条件，更新所述样本语音的标注文本；