[发明专利]优化语音识别声学模型的方法、系统、设备及存储介质有效
| 申请号: | 201810146221.8 | 申请日: | 2018-02-12 |
| 公开(公告)号: | CN108389577B | 公开(公告)日: | 2019-05-31 |
| 发明(设计)人: | 雷延强 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 510530 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 标注 声学模型 样本语音 存储介质 错误标注 语音识别 优化 比对结果 决策条件 信息对应 比对 更新 匹配 | ||
本发明实施例公开了优化语音识别声学模型的方法、系统、设备及存储介质。该方法包括:获取样本语音的标注文本,并获取样本语音基于当前声学模型得到的识别文本;比对标注文本和所述识别文本,并在比对结果为不匹配时确定标注文本相对所述识别文本的错误标注信息;根据所述错误标注信息对应的文本更新决策条件,更新所述样本语音的标注文本;基于设定量的样本语音及当前分别对应的标注文本,重新训练优化所述当前声学模型。利用该方法,能够有效提高样本语音所对应标注文本的标注质量,从而达到了优化声学模型的目的。
技术领域
本发明涉及计算机技术领域,尤其涉及优化语音识别声学模型的方法、系统、设备及存储介质。
背景技术
随着语音识别可应用范围的不断扩大,语音识别技术已成为一个新兴高技术产业,并得到更多技术人员的关注。目前,语音识别系统中的重要组成之一就是声学模型,声学模型的好坏很大程度上决定了语音识别结果的优劣,因此,需要不断对语音识别声学模型进行优化。
一般地,对声学模型的训练需要大量的样本数据支持,而样本数据往往包括语音数据及对应于语音数据的标注文本(语音数据包含的文字内容)。标注文本通常基于大量人工标注实现或通过第三方识别系统识别获得,但通过上述方法获得标注文本往往存在一定错误,影响标注质量。
对于语音识别声学模型而言,提升标注文本的标注质量相当于进行声学模型优化的其中一种手段,但是目前尚未发现通过提升标注文本质量来实现声学模型优化的技术方案。
发明内容
本发明实施例提供了优化语音识别声学模型的方法、系统、设备及存储介质,能够实现标注文本标注质量的提升,从而达到优化声学模型的目的。
第一方面,本发明实施例提供了一种优化语音识别声学模型的方法,包括:
获取样本语音的标注文本,并获取所述样本语音基于当前声学模型得到的识别文本;
比对所述标注文本和所述识别文本,并在比对结果为不匹配时确定所述标注文本相对所述识别文本的错误标注信息;
根据所述错误标注信息对应的文本更新决策条件,更新所述样本语音的标注文本;
基于设定量的样本语音及当前分别对应的标注文本,重新训练优化所述当前声学模型。
第二方面,本发明实施例提供了一种优化语音识别声学模型的装置,包括:
文本获取模块,用于获取样本语音的标注文本,并获取所述样本语音基于当前声学模型得到的识别文本;
错误标注确定模块,用于比对所述标注文本和所述识别文本,并在比对结果为不匹配时确定所述标注文本相对所述识别文本的错误标注信息;
标注文本更新模块,用于根据所述错误标注信息对应的文本更新决策条件,更新所述样本语音的标注文本;
声学模型优化模块,用于基于设定量的样本语音及当前分别对应的标注文本,重新训练优化所述当前声学模型。
第三方面,本发明实施例提供了一种计算机设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述第一方面实施例提供的优化语音识别声学模型的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面实施例提供的优化语音识别声学模型的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810146221.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:压缩后的语音识别模型的优化方法及系统
- 下一篇:智能教室语音控制系统





