[发明专利]语音识别方法、装置、系统、设备和计算机可读存储介质在审

申请号：	202010102418.9	申请日：	2020-02-19
公开（公告）号：	CN111210829A	公开（公告）日：	2020-05-29
发明（设计）人：	荣康	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L17/02	分类号：	G10L17/02;G10L17/24;G10L17/20;G10L17/04;G10L17/06
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	董慧
地址：	518000 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置系统设备计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种语音识别方法、装置、系统、设备和计算机可读存储介质。所述方法包括：获取终端被唤醒时唤醒音频中的唤醒声纹特征；根据所述唤醒声纹特征与所述终端被唤醒后对话音频中的对话声纹特征，获取所述对话音频的语音识别反馈数据；将所述语音识别反馈数据发送至所述终端，供所述终端呈现所述语音识别反馈数据。采用本方法，可避免非终端唤醒用户的音频误识别，进而有效降低非终端唤醒用户、噪音等非正常语音的误识别率，从而有效提高语音识别的准确率。

技术领域

本申请涉及语音处理技术领域，特别是涉及一种语音识别方法、装置、系统、设备和计算机可读存储介质。

背景技术

随着语音处理技术的快速发展，全双工语音交互技术因其可实时预测人类即将说出的内容、实时生成回应，并控制对话节奏等特点，被越来越多地应用于长程语音交互场景。

传统技术中，涉及于全双工语音交互技术的语音识别方法，通常采用训练全双工语义抗噪模型的方式在云端识别出具体的噪音文本，进而将识别出的噪音文本进行屏蔽，以降低噪音误识别概率，但是该方法在应用于人声负责的公共场所等特殊场景时，极易将同一时刻说话的待识别用户语音与其他用户语音同时录入并错误识别，以致无法区别其中的有效音频信息。

因此，目前的语音识别方法存在语音识别准确率低的技术问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高语音识别准确率的语音识别方法、装置、系统、设备和计算机可读存储介质。

一种语音识别方法，所述方法包括：

获取终端被唤醒时唤醒音频中的唤醒声纹特征；

根据所述唤醒声纹特征与所述终端被唤醒后对话音频中的对话声纹特征，获取所述对话音频的语音识别反馈数据；

将所述语音识别反馈数据发送至所述终端，供所述终端呈现所述语音识别反馈数据。

一种语音识别方法，所述方法包括：

接收用户通过唤醒音频发起的语音识别请求；

响应于所述语音识别请求，确定所述唤醒音频中的唤醒词；

当所述唤醒音频中的唤醒词与预设唤醒词相匹配时，将所述唤醒音频发送至服务器；

接收对话音频，并将所述对话音频发送至所述服务器，供所述服务器根据所述对话音频中的对话声纹特征与所述唤醒音频中的唤醒声纹特征，获取语音识别反馈数据；