[发明专利]语音识别方法及装置、存储介质及电子设备在审
| 申请号: | 202110062350.0 | 申请日: | 2021-01-18 |
| 公开(公告)号: | CN113782005A | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 雪巍;蔡玉玉;吴俊仪;彭毅;范璐;杨帆;丁国宏;何晓冬 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/22;G10L15/26 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
| 地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 装置 存储 介质 电子设备 | ||
本公开提供了一种语音识别方法、语音识别装置、计算机可读存储介质和电子设备。该方法包括:获取样本语音信号,对样本语音信号进行解码,获得解码结果,从解码结果中提取第一特征,第一特征包含样本语音信号的前置字信息;从样本语音信号中抽取目标语音片段,获取目标语音片段的对数幅度谱;根据对数幅度谱确定第二特征,第二特征为样本语音信号的二维时频域特征;将第一特征和第二特征结合得到第三特征;使用第三特征对未经训练的分类器进行训练,获得经训练的分类器;获取待识别语音信号的待识别第三特征,以确定待识别第三特征中是否含有前置字。本公开提供一种对含有前置字的短字词进行识别的方法。
技术领域
本公开涉及语音识别技术领域,具体而言,涉及一种语音识别方法、语音识别装置、计算机可读存储介质和电子设备。
背景技术
语音识别技术是一种将人的语音转换为文本的技术,广泛应用于各类人工智能产品中,比如智能对话机器人、智能音箱、智能翻译设备等,并主要通过人机对话的方式来实现信息的交换。
在日常的人机对话过程中,用户通常会通过回答例如“是/不是”、“对/不对”、“买/没买”等短字词来表明自己的意图,因此,对这些短字词识别的准确率也显得尤为重要。
现有的大规模连续语音识别框架所使用的模型训练语料中,上述短字词的占比非常小,并没有专门针对上述含有前置字的短字词进行识别的方法。
发明内容
本公开提供一种语音识别方法、语音识别装置、计算机可读存储介质和电子设备,进而提供一种对含有前置字的短字词进行识别的方法。
根据本公开的第一方面,提供了一种语音识别方法,包括:获取样本语音信号,对所述样本语音信号进行解码,获得解码结果,从所述解码结果中提取第一特征,所述第一特征包含所述样本语音信号的前置字信息;从所述样本语音信号中抽取目标语音片段,获取所述目标语音片段的对数幅度谱;根据所述对数幅度谱确定第二特征,所述第二特征为所述样本语音信号的二维时频域特征;将所述第一特征和所述第二特征结合,得到第三特征;使用所述第三特征对未经训练的分类器进行训练,获得经训练的分类器;获取待识别语音信号的待识别第三特征,使用所述经训练的分类器对所述待识别第三特征进行分类,以确定所述待识别第三特征中是否含有所述前置字。
根据本公开的第二方面,提供了一种语音识别装置,包括:第一特征获取模块,用于获取样本语音信号,对所述样本语音信号进行解码,获得解码结果,从所述解码结果中提取第一特征,所述第一特征包含所述样本语音信号的前置字信息;第二特征获取模块,用于从所述样本语音信号中抽取目标语音片段,获取所述目标语音片段的对数幅度谱;根据所述对数幅度谱确定第二特征,所述第二特征为所述样本语音信号的二维时频域特征;第三特征获取模块,用于将所述第一特征和所述第二特征结合,得到第三特征;分类器训练模块,用于使用所述第三特征对未经训练的分类器进行训练,获得经训练的分类器;分类识别模块,用于获取待识别语音信号的待识别第三特征,使用所述经训练的分类器对所述待识别第三特征进行分类,以确定所述待识别第三特征中是否含有所述前置字。
根据本公开的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的语音识别方法。
根据本公开的第四方面,提供了一种电子设备,包括处理器;存储器,用于存储一个或多个程序,当一个或多个程序被处理器执行时,使得所述处理器实现上述的语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110062350.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速对五种疟原虫检测并分型的方法
- 下一篇:一种具有全景拍摄功能的无人机





