[发明专利]语音识别方法、装置及终端在审
| 申请号: | 202011118270.4 | 申请日: | 2020-10-19 | 
| 公开(公告)号: | CN114387958A | 公开(公告)日: | 2022-04-22 | 
| 发明(设计)人: | 高莹莹 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 | 
| 主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/06 | 
| 代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;曹娜 | 
| 地址: | 100053 北*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 装置 终端 | ||
本发明提供一种语音识别方法、装置及终端,解决采用现有语音识别技术进行语音识别错误率高,领域兼容性差的问题。本发明的方法包括:获取待识别的语音数据,所述待识别的语音数据包括多个领域的语音数据;基于预先构建的第一语音识别模型,对所述待识别的语音数据进行语音识别。本发明通过获取待识别的语音数据,该待识别的语音数据包括多个领域的语音数据;基于预先构建的第一语音识别模型,对待识别的语音数据进行语音识别,如此,利用具备领域兼容性的第一语音识别模型,能够准确识别不同领域的词语,提升语音识别的准确率。
技术领域
本发明涉及计算机技术领域,尤其是涉及一种语音识别方法、装置及终端。
背景技术
随着人工智能技术的发展,语音识别技术取得了巨大的进步。现有技术中,语音识别主要针对神经网络,而其他网络结构尤其是没有梯度下降的算法无法采用;或者,利用元学习的方法实现对于子任务权重的自动估计,但是元学习的目标是习得一个在新任务上能表现较好的泛化模型,而对于当前任务不一定表现最优;或者只考虑静态样本标注,未考虑每轮迭代过程中对两个领域的识别性能,从而导致采用现有语音识别技术进行语音识别错误率高,领域兼容性差的问题。
发明内容
本发明的目的在于提供一种语音识别方法、装置及终端,用于解决采用现有语音识别技术进行语音识别错误率高,领域兼容性差的问题。
为了达到上述目的,本发明提供一种语音识别方法,包括:
获取待识别的语音数据,所述待识别的语音数据包括多个领域的语音数据;
基于预先构建的第一语音识别模型,对所述待识别的语音数据进行语音识别。
其中,获取待识别的语音数据之前,所述方法还包括:
获取第一语料数据,所述第一语料数据包括多个领域的语音数据;
基于所述第一语料数据进行模型训练,得到第二语音识别模型;
对所述第二语音识别模型进行验证,得到目标领域词语的漏查与误查比;
根据所述漏查与误查比,调整所述第二语音识别模型,得到第一语音识别模型。
其中,所述目标领域词语的漏查包括:所述目标领域词语被识别为其他领域词语的次数,以及所述目标领域词语未被识别出的次数;
所述目标领域词语的误查包括:其他领域词语被识别为所述目标领域词语的次数,以及被多余识别为所述目标领域词语的次数。
其中,所述对所述第一语音识别模型进行验证,得到目标领域词语的漏查与误查比,包括:
通过验证数据,对所述第二语音识别模型进行验证识别,得到识别结果,所述验证数据为所述第一语料数据中的部分数据;
根据所述识别结果,得到目标领域词语的漏查与误查比。
其中,所述根据所述识别结果,得到目标领域词语的漏查与误查比,包括:
对所述识别结果进行统计,得到所述目标领域词语的漏查和误查;
根据所述目标领域词语的漏查和误查,计算得到所述目标领域词语的漏查与误查比。
其中,对所述第二语音识别模型进行验证,得到目标领域词语的漏查与误查比之前,所述方法还包括:
将所述第一语料数据对应的文本数据,进行分词处理,得到多个词语;
对所述多个词语,基于所属领域进行词语筛选,得到对应各个领域的领域词语。
其中,所述根据所述漏查与误查比,调整所述第一语音识别模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011118270.4/2.html,转载请声明来源钻瓜专利网。





