[发明专利]一种语音识别方法、装置、设备及计算机可读存储介质有效
申请号: | 202110233724.0 | 申请日: | 2021-03-03 |
公开(公告)号: | CN113035179B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 尤祖寰 | 申请(专利权)人: | 中国科学技术大学;科大讯飞股份有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张柳 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 计算机 可读 存储 介质 | ||
本申请提供了一种语音识别方法、装置、设备及计算机可读存储介质,其中,语音识别方法包括:根据待识别的目标语音和目标关键词,确定当前解码时刻的第一上下文向量,其中,目标语音为针对目标问题的作答语音,目标关键词为目标问题中包含的关键词,和/或目标问题对应的标准答案中包含的关键词;根据目标问题和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量;根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果。本申请提供的语音识别方法在确定当前解码时刻解码所需的上下文向量时,由于结合了目标关键词和与目标关键词有关的目标问题,因此,基于确定出的上下文向量能够较为准确地识别出目标语音中的关键词。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种语音识别方法、装置、设备及计算机可读存储介质。
背景技术
语音识别技术为将语音信号转变为相应文本的技术。目前的语音识别方案通常为基于语音识别模型的识别方案,在过去的这几年里,基于注意力机制的端到端的语音识别模型引发了广泛的关注,在语音识别任务中,基于注意力机制的端到端的语音识别模型用一个单一的神经网络取代了传统的声学模型、发音模型、语言模型组合,并且能够通过统一目标进行优化。
基于注意力机制的端到端的语音识别模型虽然得到广泛应用,但也有一些问题随之而来。在问答场景中,用户对一些关键词较为关注,希望根据语音识别模型能够准确识别出语音中的关键词,然而,由于问答场景中的关键词通常为低频词,而训练数据集中包含关键词的训练数据较少,因此,根据训练得到的语音识别模型对问答场景中的语音进行识别时,对于关键词的识别效果不佳。
发明内容
有鉴于此,本申请提供了一种语音识别方法、装置、设备及计算机可读存储介质,用以解决现有技术中的语音识别方案对问答场景中关键词的识别效果不佳的问题,其技术方案如下:
一种语音识别方法,包括:
根据待识别的目标语音和目标关键词,确定当前解码时刻的第一上下文向量,其中,所述目标语音为针对目标问题的作答语音,所述目标关键词为所述目标问题中包含的关键词,和/或所述目标问题对应的标准答案中包含的关键词;
根据所述目标问题和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量;
根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果。
可选的,所述根据待识别的目标语音以及目标关键词,确定当前解码时刻的第一上下文向量,根据所述目标问题和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量,根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果,包括:
利用预先训练得到的语音识别模型处理所述目标语音、所述目标关键词和所述目标问题,得到所述语音识别模型输出的所述目标语音的识别结果,其中,所述语音识别模型采用训练语音、所述训练语音对应的标注文本,同时辅以对应的关键词和问题训练得到。
可选的,所述语音识别模型包括:语音编码器、关键词编码器、问题编码器、注意力模块和解码器;
所述语音编码器对所述目标语音中各语音帧分别对应的语音特征进行编码,得到所述目标语音中各语音帧分别对应的特征向量;
所述关键词编码器对所述目标关键词进行编码,得到所述目标关键词对应的特征向量;
所述问题编码器对所述目标问题进行编码,得到所述目标问题对应的特征向量;
所述注意力模块根据所述目标语音中各语音帧分别对应的特征向量和所述目标关键词对应的特征向量,确定当前解码时刻的第一上下文向量,根据所述目标问题对应的特征向量和当前解码时刻的第一上下文向量,确定当前解码时刻的第二上下文向量;
所述解码器根据当前解码时刻的第二上下文向量,确定当前解码时刻的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学;科大讯飞股份有限公司,未经中国科学技术大学;科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110233724.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于近红外光谱的青萝卜品质检测方法
- 下一篇:一种便于定位的裁剪机