[发明专利]一种语音识别方法、装置、设备及计算机可读存储介质有效
申请号: | 202110233724.0 | 申请日: | 2021-03-03 |
公开(公告)号: | CN113035179B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 尤祖寰 | 申请(专利权)人: | 中国科学技术大学;科大讯飞股份有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张柳 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种语音识别方法,其特征在于,包括:
根据待识别的目标语音和目标关键词,确定当前解码时刻的第一上下文向量,其中,所述目标语音为针对目标问题的作答语音,所述目标关键词为所述目标问题中包含的关键词,和/或所述目标问题对应的标准答案中包含的关键词;
根据所述目标问题和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量;
根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果。
2.根据权利要求1所述的语音识别方法,其特征在于,所述根据待识别的目标语音以及目标关键词,确定当前解码时刻的第一上下文向量,根据所述目标问题和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量,根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果,包括:
利用预先训练得到的语音识别模型处理所述目标语音、所述目标关键词和所述目标问题,得到所述语音识别模型输出的所述目标语音的识别结果,其中,所述语音识别模型采用训练语音、所述训练语音对应的标注文本,同时辅以对应的关键词和问题训练得到。
3.根据权利要求2所述的语音识别方法,其特征在于,所述语音识别模型包括:语音编码器、关键词编码器、问题编码器、注意力模块和解码器;
所述语音编码器对所述目标语音中各语音帧分别对应的语音特征进行编码,得到所述目标语音中各语音帧分别对应的特征向量;
所述关键词编码器对所述目标关键词进行编码,得到所述目标关键词对应的特征向量;
所述问题编码器对所述目标问题进行编码,得到所述目标问题对应的特征向量;
所述注意力模块根据所述目标语音中各语音帧分别对应的特征向量和所述目标关键词对应的特征向量,确定当前解码时刻的第一上下文向量,根据所述目标问题对应的特征向量和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量;
所述解码器根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果。
4.根据权利要求3所述的语音识别方法,其特征在于,所述注意力模块根据所述目标语音中各语音帧分别对应的特征向量和所述目标关键词对应的特征向量,确定当前解码时刻的第一上下文向量,包括:
所述注意力模块根据所述目标语音中各语音帧分别对应的特征向量、所述目标关键词对应的特征向量以及所述解码器在前一解码时刻的隐层输出向量,确定所述目标语音中各语音帧分别对应的权重;
所述注意力模块按所述目标语音中各语音帧分别对应的权重,对所述目标语音中各语音帧分别对应的特征向量加权求和,加权求和后得到的向量作为当前解码时刻的第一上下文向量。
5.根据权利要求3所述的语音识别方法,其特征在于,所述注意力模块根据所述目标问题对应的特征向量和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量,包括:
所述注意力模块将所述目标问题对应的特征向量与当前解码时刻的第一上下文向量进行融合,得到同时包含有所述目标问题的信息和所述目标关键词的信息的融合向量;
所述注意力模块根据所述融合向量、所述目标语音中各语音帧分别对应的特征向量,确定当前解码时刻的第二上下文向量。
6.根据权利要求5所述的语音识别方法,其特征在于,所述注意力模块根据所述融合向量、所述目标语音中各语音帧分别对应的特征向量,确定当前解码时刻的第二上下文向量,包括:
所述注意力模块根据所述融合向量,从所述目标语音中各语音帧分别对应的特征向量中提取与当前解码时刻相关的特征向量;
所述注意力模块根据从所述目标语音中各语音帧分别对应的特征向量中提取出的特征向量,确定所述目标语音中各语音帧分别对应的权重;
所述注意力模块按所述目标语音中各语音帧分别对应的权重,对所述目标语音中各语音帧分别对应的特征向量加权求和,加权求和后得到的向量作为当前解码时刻的第二上下文向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学;科大讯飞股份有限公司,未经中国科学技术大学;科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110233724.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于近红外光谱的青萝卜品质检测方法
- 下一篇:一种便于定位的裁剪机