[发明专利]语音识别方法、装置及终端在审

申请号：	202011118270.4	申请日：	2020-10-19
公开（公告）号：	CN114387958A	公开（公告）日：	2022-04-22
发明（设计）人：	高莹莹	申请（专利权）人：	中国移动通信有限公司研究院;中国移动通信集团有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;G10L15/06
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	许静;曹娜
地址：	100053 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置终端
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种语音识别方法、装置及终端，解决采用现有语音识别技术进行语音识别错误率高，领域兼容性差的问题。本发明的方法包括：获取待识别的语音数据，所述待识别的语音数据包括多个领域的语音数据；基于预先构建的第一语音识别模型，对所述待识别的语音数据进行语音识别。本发明通过获取待识别的语音数据，该待识别的语音数据包括多个领域的语音数据；基于预先构建的第一语音识别模型，对待识别的语音数据进行语音识别，如此，利用具备领域兼容性的第一语音识别模型，能够准确识别不同领域的词语，提升语音识别的准确率。

技术领域

本发明涉及计算机技术领域，尤其是涉及一种语音识别方法、装置及终端。

背景技术

随着人工智能技术的发展，语音识别技术取得了巨大的进步。现有技术中，语音识别主要针对神经网络，而其他网络结构尤其是没有梯度下降的算法无法采用；或者，利用元学习的方法实现对于子任务权重的自动估计，但是元学习的目标是习得一个在新任务上能表现较好的泛化模型，而对于当前任务不一定表现最优；或者只考虑静态样本标注，未考虑每轮迭代过程中对两个领域的识别性能，从而导致采用现有语音识别技术进行语音识别错误率高，领域兼容性差的问题。

发明内容

本发明的目的在于提供一种语音识别方法、装置及终端，用于解决采用现有语音识别技术进行语音识别错误率高，领域兼容性差的问题。

为了达到上述目的，本发明提供一种语音识别方法，包括：

获取待识别的语音数据，所述待识别的语音数据包括多个领域的语音数据；

基于预先构建的第一语音识别模型，对所述待识别的语音数据进行语音识别。

其中，获取待识别的语音数据之前，所述方法还包括：

获取第一语料数据，所述第一语料数据包括多个领域的语音数据；

基于所述第一语料数据进行模型训练，得到第二语音识别模型；

对所述第二语音识别模型进行验证，得到目标领域词语的漏查与误查比；

根据所述漏查与误查比，调整所述第二语音识别模型，得到第一语音识别模型。

其中，所述目标领域词语的漏查包括：所述目标领域词语被识别为其他领域词语的次数，以及所述目标领域词语未被识别出的次数；

所述目标领域词语的误查包括：其他领域词语被识别为所述目标领域词语的次数，以及被多余识别为所述目标领域词语的次数。