[发明专利]语音识别的声学模型训练方法、系统、设备及介质在审

申请号：	202010749271.2	申请日：	2020-07-30
公开（公告）号：	CN111883110A	公开（公告）日：	2020-11-03
发明（设计）人：	李明;江文斌;李健	申请（专利权）人：	上海携旅信息技术有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/04;G10L15/26
代理公司：	上海弼兴律师事务所 31283	代理人：	杨东明;刘潇
地址：	201803 上海市嘉***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别声学模型训练方法系统设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音识别的声学模型训练方法、系统、设备及介质，获取训练样本，将第一语音片段分别输入多个预设的不同的基准语音识别模型中进行识别，以获取多个识别文本，计算每两个识别文本间的相似度值，以确定第一语音片段对应的文本得分，判断文本得分是否大于预设阈值，若是，则将文本得分对应的第一语音片段筛选出来，以作为第三语音片段，基于第三语音片段和第二语音片段训练生成语音识别模型。本发明解决了人工标注训练数据集费时费力，无法在短时间形成大量训练数据集，造成语音识别的字错率高的缺陷，提高了语音识别模型识别的准确性。

技术领域

本发明涉及语音识别技术领域，尤其涉及一种语音识别的声学模型训练方法、系统、设备及介质。

背景技术

语言是人类思想重要的载体，语音识别技术是利用机器接收、识别和理解语音信号，并将其转换成相应数字信号的技术。伴随着语音识别技术的不断发展，基于语音识别的应用也越来越广泛，这样的技术已经渗透入家庭生活、办公领域、娱乐等方面。语音识别技术使得语音输入、语音搜索、智能语音客服等产品进入消费电子领域。

客服录音电话场景下的语音识别是十分复杂的，由于客服所属地域方言以及个人发音口语化的习惯不同，需要大量的语料以及足够的场景，去训练语音识别声学模型。由于大量的语音标注过程既昂贵又费时，无法在短期内获取到充足的、人工标注完成后的训练数据集合，最终造成语音识别的字错率高。

发明内容

本发明要解决的技术问题是为了克服现有技术中由于人工标注费时费力，无法在短时间形成大量训练数据集，造成语音识别的字错率高的缺陷，提供一种语音识别的声学模型训练方法、系统、设备及介质。

本发明是通过下述技术方案来解决上述技术问题：

第一方面，本发明提供一种语音识别的声学模型训练方法，包括以下步骤：

获取训练样本；其中，所述训练样本包括无标签的多个第一语音片段和有标签的多个第二语音片段；

将所述第一语音片段分别输入多个预设的不同的基准语音识别模型中进行识别，以获取多个识别文本；

计算每两个所述识别文本间的相似度值，以确定所述第一语音片段对应的文本得分；