[发明专利]一种语音识别方法、装置、设备及介质在审
申请号: | 201910710043.1 | 申请日: | 2019-07-31 |
公开(公告)号: | CN111739514A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 马浩 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/10;G10L15/26 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 介质 | ||
本发明实施例公开了一种语音识别方法、装置、设备及介质,所述方法包括:获取待识别语音数据,确定待识别语音数据对应的原始拼音数据;对所述原始拼音数据进行校正,得到待匹配拼音数据;将所述待匹配拼音数据与预先构建的标准拼音序列进行匹配,根据匹配结果确定所述待识别语音数据对应的文本数据。本发明实施例提供的语音识别方法通过对原始拼音数据进行校正,基于校正后的语音数据进行识别,提高了语音识别的准确率,进而提高了语音智能客服的应答准确度。
技术领域
本发明实施例涉及信息处理领域,尤其涉及一种语音识别方法、装置、设备及介质。
背景技术
随着网络技术的不断发展,语音识别的应用也越来越广泛,如在语音智能客服的应答场景下,可以通过语音应答交互,达到语音机器人在应答场景下解决用户问题的目的。
实现语音智能客服的应答包括:将用户输入的语音转文字,基于语音转文字结果识别用户意图,基于用户意图获取与文字对应的应答文本,然后将应答文本转语音进行播报应答。目前语音转文字的主要方式为:通过采集语音样本,对语音样本中的特征进行标注,然后基于深度学习的算法(如循环神经网络、卷机神经网络等)训练模型,得到训练好的语音识别模型,通过训练好的语音识别模型进行语音的实时识别,将语音转为文字。
在实现本发明的过程中,发明人发现现有技术中至少存在以下技术问题:使用通用语音语料训练,会导致识别结果相对固定,但是由于用户的口音和中文表述的特点以及背景噪音或用户口述的音量变化,造成比如近音词识别错误、识别漏词等问题,导致语音转文字结果有误,进而基于语音转文字结果的用户意图识别与用户实际意图不一致,导致应答不准确,且用户表述千变万化,训练出适用于所有用户的模型不易实现。
发明内容
本发明实施例提供了一种语音识别方法、装置、设备及介质,以实现提高语音识别的准确率,进而提高语音智能客服的应答准确度。
第一方面,本发明实施例提供了一种语音识别方法,包括:
获取待识别语音数据,确定待识别语音数据对应的原始拼音数据;
对所述原始拼音数据进行校正,得到待匹配拼音数据;
将所述待匹配拼音数据与预先构建的标准拼音序列进行匹配,根据匹配结果确定所述待识别语音数据对应的文本数据。
第二方面,本发明实施例还提供了一种语音识别装置,包括:
拼音数据获取模块,用于获取待识别语音数据,确定待识别语音数据对应的原始拼音数据;
拼音数据校准模块,用于对所述原始拼音数据进行校正,得到待匹配拼音数据;
文本数据确定模块,用于将所述待匹配拼音数据与预先构建的标准拼音序列进行匹配,根据匹配结果确定所述待识别语音数据对应的文本数据。
第三方面,本发明实施例还提供了一种计算机设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的语音识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的语音识别方法。
本发明实施例通过获取待识别语音数据,确定待识别语音数据对应的原始拼音数据;对所述原始拼音数据进行校正,得到待匹配拼音数据;将所述待匹配拼音数据与预先构建的标准拼音序列进行匹配,根据匹配结果确定所述待识别语音数据对应的文本数据,通过对原始拼音数据进行校正,基于校正后的语音数据进行识别,提高了语音识别的准确率,进而提高了语音智能客服的应答准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910710043.1/2.html,转载请声明来源钻瓜专利网。