[发明专利]一种语音识别方法、装置及存储介质有效
申请号: | 202010111854.2 | 申请日: | 2020-02-24 |
公开(公告)号: | CN111261161B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 生士东 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L25/87;G10L15/06;G10L15/16 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 存储 介质 | ||
本发明涉及语音识别技术领域,尤其涉及一种语音识别方法、装置及存储介质。本发明在接收语音对象的语音过程中,当语音中尾端静音到达第一预设时间时,即获取目标语音上传至语音识别服务器,使语音识别服务器在语音完全结束前提前对目标语音进行语音识别,获得预处理结果,在语音中尾端静音到达第二预设时间即语音完全结束时,向语音识别服务器请求语音识别,服务器可以根据预处理结果快速确定并下发语音识别结果,使客户端在确认语音完全结束时能即时获得该语音的语音识别结果,减少客户端获取服务器数据处理结果的等待时长。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别方法、装置及存储介质。
背景技术
随着电子设备的不断发展,作为电子设备的重要组成部分——电子设备的控制系统,例如,语音控制系统,也在不断地发展,随着语音识别技术迅速发展成熟,各种语音识别软件纷纷亮相,使得人与电子设备的交流变得简单、有趣。为了避免人与电子设备进行语音控制时产生误操作,可以设置唤醒词,当电子设备接收到与自身匹配的唤醒词时,才会接收外界的语音控制信息,并依据语音控制信息执行相应的操作。
用户每次与电子设备进行语音交互时,电子设备接收到用户的语音,将用户的语音传送至服务端,由服务端来进行语音识别,然后按照用户的指示进行操作。通常,向服务器传送的语音必须是完整的音频数据,完整的音频数据包括四部分音频数据,分别为唤醒音频数据、VAD(Voice Activity Detection,语音端点检测)静音前端数据、说话过程中的音频数据和说话结束后的静音结束音频数据。其中,唤醒音频数据可表现为唤醒词,用于唤醒电子设备;VAD静音前端数据是针对目前行业内VAD前端点检测出现的延迟现象(即当检测到VAD前端点的时候,当前人已经说了一段时间的话了),为确保整体识别的准确性而增加前推保护;说话过程中的音频数据可以包含人对电子设备发出的控制指令;静音结束音频数据用于确定说话结束,由于人说话的过程中存在停顿,不能检测到静音就认为说话结束,因此需要持续观察一段时间(例如500ms),发现持续静音才认为说话结束。用户与电子设备语音交互过程中,电子设备须等待用户说完话并持续静音一段时间,才能将完整的音频数据上传至服务器,等待服务器对音频数据进行识别后方能获得服务器反馈的识别结果,这个过程中,用户自说话结束到收到电子设备的反馈,需要等待的时间为电子设备判断用户说话结束花费的时间、服务器处理音频获得识别结果的时间及电子设备与服务器之间数据传输耗时的总和,用户等待耗时较长,交互体验有待提高。
发明内容
本发明提供了一种语音识别方法、装置及存储介质,可以在确定语音对象的语音结束后及时获得语音识别结果,减少客户端等待响应的时间,提升交互体验。
第一方面,本发明提供了一种语音识别方法,该方法包括:
接收语音对象的语音,所述语音包括至少一个单元语音,每个所述单元语音包括指令语音和所述指令语音结束后的尾端静音;
根据语音接收的时序确定当前单元语音;
对于所述当前单元语音,执行下述数据处理操作:
在所述当前单元语音的尾端静音的持续时长到达第一预设时间时,基于接收到的语音确定目标语音,将所述目标语音传输至语音识别服务器;以使所述语音识别服务器对所述目标语音进行预处理,获得预处理结果;
在所述尾端静音的持续时长到达所述第二预设时间时,向所述语音识别服务器发送语音识别请求;以使所述语音识别服务器根据所述预处理结果确定对所述语音识别请求的响应数据;
接收所述语音识别服务器返回的所述响应数据。
第二方面,本发明提供了另一种语音识别方法,所述方法包括:
接收客户端上传的目标语音,所述目标语音为客户端接收语音的过程中,当所述语音中当前单元语音的尾端静音的持续时长到达第一预设时间时,根据接收到的语音确定的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010111854.2/2.html,转载请声明来源钻瓜专利网。