[发明专利]语音识别模型的训练方法、语音识别方法及装置有效
| 申请号: | 202010891788.5 | 申请日: | 2020-08-31 |
| 公开(公告)号: | CN111816171B | 公开(公告)日: | 2020-12-11 |
| 发明(设计)人: | 李成飞;杨嵩;徐高鹏 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/183 |
| 代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 郭丽祥;武晨燕 |
| 地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 模型 训练 方法 装置 | ||
本申请提出一种语音识别模型的训练方法、语音识别方法及装置,其中,语音识别模型的训练方法包括:利用第一通用语料,训练得到语言模型模块;利用所述语言模型模块,得到初始的语音识别模型;利用语音识别标注语料,训练所述初始的语音识别模型,得到收敛的语音识别模型。本申请实施例可以使语音识别模型掌握充足的语言规律信息,提高语音识别的准确率。
技术领域
本申请涉及语音识别领域,尤其涉及一种语音识别模型的训练方法、语音识别方法及装置。
背景技术
随着深度学习的快速发展,基于深度神经网络的端到端(End-to-End,E2E)模型在自动语音识别领域得到了广泛的关注和研究,成为语音识别领域新研究热点。端到端语音识别模型利用语音和文本成对的标注语料训练得到,所掌握的自然语言规律有限,因此,存在识别准确度低的问题。
发明内容
本申请实施例提供一种语音识别模型的训练方法、语音识别方法及装置,以解决相关技术存在的问题,技术方案如下:
第一方面,本申请实施例提供了一种语音识别模型的训练方法,包括:
利用第一通用语料,训练得到语言模型模块;
利用所述语言模型模块,得到初始的语音识别模型,所述初始的语音识别模型包括声学模型模块、融合模块和所述语言模型模块;
利用语音识别标注语料,训练所述初始的语音识别模型,得到收敛的语音识别模型。
在一种实施方式中,所述语言模型模块用于对目标语音中的第一语音单元进行语言规律识别,得到所述第一语音单元的语言规律信息;
所述声学模型模块用于对所述目标语音中的第二语音单元进行声学特征提取,得到所述第二语音单元的声学特征;
所述融合模块用于将第一语音单元的语言规律信息与第二语音单元的声学特征融合,得到所述第二语音单元的识别结果;
其中,所述第一语音单元是在所述第二语音单元之前的语音单元。
在一种实施方式中,该方法还包括:
利用第二通用语料以及与目标场景对应的第一专用语料,得到融合语料;
利用所述融合语料,对所述语言模型模块进行微调训练。
在一种实施方式中,所述利用第二通用语料以及与目标场景对应的第一专用语料,得到融合语料,包括:
根据融合插值比例,对所述第二通用语料和所述第一专用语料进行融合,得到所述融合语料。
在一种实施方式中,还包括:
利用所述第二通用语料,训练得到通用语言模型;
利用所述第一专用语料,训练得到专用语言模型;
利用所述通用语言模型,测试与所述目标场景对应的第二专用语料的困惑度,得到第一测试结果;
利用所述专用语言模型,测试所述第二专用语料的困惑度,得到第二测试结果;
根据所述第一测试结果和所述第二测试结果,确定所述融合插值比例。
在一种实施方式中,所述利用所述第二通用语料,训练得到通用语言模型,包括:
根据文本匹配算法,在所述第二通用语料中选取与所述第二专用语料匹配的语料;
利用所述与所述第二专用语料匹配的语料,训练得到所述通用语言模型。
第二方面,本申请实施例提供了一种语音识别方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010891788.5/2.html,转载请声明来源钻瓜专利网。





