[发明专利]语音识别模型的训练方法及装置、语音识别方法及装置在审
申请号: | 202011540305.3 | 申请日: | 2020-12-23 |
公开(公告)号: | CN112700766A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 吴凡;贾杨;卓邦声;林倩倩;郭涵涛;李振权;夏龙;郭常圳 | 申请(专利权)人: | 北京猿力未来科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/22;G10L15/26;G10L25/51;G10L25/87 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 刘晓楠 |
地址: | 100102 北京市朝阳区广顺南大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 训练 方法 装置 | ||
本说明书提供语音识别模型的训练方法及装置、语音识别方法及装置,其中语音识别模型的训练方法包括:获取语音样本对;通过语音识别模型的全连接层获得第一语音样本的第一样本向量和第二语音样本的第二样本向量;根据第一样本向量和第二样本向量之间的相似度,以及样本对标签,计算语音识别模型的损失值;根据语音识别模型的损失值,对语音识别模型进行训练,直至达到训练停止条件,得到训练后的语音识别模型。本说明书中引入了基于样本对的语音识别模型的损失值,该损失值使得语音识别模型具有准确抽取语音内容信息的能力,使得新增待识别的关键词时,无需重新训练语音识别模型,只需准备少量该关键词的标准语音即可。
技术领域
本说明书涉及语音处理技术领域,特别涉及语音识别模型的训练方法及装置、语音识别方法及装置。
背景技术
随着计算机技术和网络技术的飞速发展和广泛应用,存在很多需要进行语音识别的场景。例如,语音单词识别游戏中,需要基于用户说话语音检测其中是否存在屏幕上展示的单词(目标关键词);或者,可以通过语音对设备进行控制,因此设备需要对用户的语音进行识别,得到目标关键词,再基于目标关键词触发对应的操作指令,以对设备进行操作。
现有技术中,一般是基于卷积神经网络(CNN)预测说话语音属于给定关键词类别中的哪一类,以确定说话语音中是否包括给定关键词。具体的,该方案需要对语音进行分帧处理后,将每个语音帧输入卷积神经网络进行预测,得到该语音帧属于各个给定关键词的概率,然后使用比语音分帧窗口更大的滑动窗口对语音帧的概率进行平滑处理后得到该语音帧属于各个给定关键词的置信度,最终基于置信度预测该语音帧中是否存在给定关键词。
然而,上述语音识别方法,卷积神经网络的输出使用归一化指数函数softmax函数进行分类预测,该softmax函数的维度为给定关键词的个数,当新增关键词时,softmax的维度也要相应的增加,需要重新训练模型,由于训练模型需要收集一定量级的该新增关键词的语音数据,因此时间及人力成本高。另外,在对语音进行分帧,预测每个语音帧属于各个给定关键词的概率后,还需要再使用比语音帧窗口更大的滑动窗口对语音帧的概率进行平滑处理得到语音帧属于各个给定关键词的置信度,其中,具体的平滑策略的方法和平滑使用的窗口需要根据实际的情况进程调整,流程较为繁琐。进而需要更简单更便捷的方法进行语音识别的操作或者处理。
发明内容
有鉴于此,本说明书实施例提供了一种语音识别模型的训练方法及装置,一种语音识别方法及装置,一种计算设备,一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种语音识别模型的训练方法,所述方法包括:
获取语音样本对,所述语音样本对包括第一语音样本和第二语音样本,且所述语音样本对携带有样本对标签,所述样本对标签用于标识所述第一语音样本和所述第二语音样本是否相同;
通过语音识别模型的全连接层获得所述第一语音样本的第一样本向量和所述第二语音样本的第二样本向量;
根据所述第一样本向量和所述第二样本向量之间的相似度,以及所述样本对标签,计算所述语音识别模型的损失值;
根据所述语音识别模型的损失值,对所述语音识别模型进行训练,直至达到训练停止条件,得到训练后的语音识别模型。
根据本说明书实施例的第二方面,提供了一种语音识别方法,所述方法包括:
获取待识别语音片段和预设关键词标准库,所述预设关键词标准库包括至少一个标准语音,每个所述标准语音对应至少一个预设关键词;
将所述待识别语音片段和第一标准语音输入语音识别模型中,获得所述语音识别模型的全连接层输出的所述待识别语音片段对应的第一语音向量,以及所述第一标准语音对应的标准语音向量,其中,所述第一标准语音为所述预设关键词标准库中包括的任一标准语音,所述语音识别模型是通过上述第一方面所述的训练方法训练得到的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猿力未来科技有限公司,未经北京猿力未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011540305.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:球泡灯自动包装设备
- 下一篇:一种碳纤维生产用的混料加工罐及其工作方法