[发明专利]一种语音识别方法、装置及存储介质有效
申请号: | 202010111854.2 | 申请日: | 2020-02-24 |
公开(公告)号: | CN111261161B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 生士东 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L25/87;G10L15/06;G10L15/16 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 存储 介质 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
接收语音对象的语音,所述语音包括至少一个单元语音,每个所述单元语音包括指令语音和所述指令语音结束后的尾端静音;
根据语音接收的时序确定当前单元语音;
对于所述当前单元语音,执行下述数据处理操作:
在所述当前单元语音的尾端静音的持续时长到达第一预设时间时,基于接收到的语音确定目标语音,将所述目标语音传输至语音识别服务器;以使所述语音识别服务器对所述目标语音进行预处理,获得预处理结果;所述第一预设时间的范围为50-300ms;
在所述尾端静音的持续时长到达第二预设时间时,向所述语音识别服务器发送语音识别请求;以使所述语音识别服务器根据所述预处理结果确定对所述语音识别请求的响应数据;所述第二预设时间为500ms;所述语音识别服务器为区块链中的节点;
接收所述语音识别服务器返回的所述响应数据;所述响应数据为语音识别结果;所述语音识别结果为所述预处理结果;
所述所述语音识别服务器对所述目标语音进行预处理,获得预处理结果包括:
根据目标语音接收的时序确定待处理语音;所述待处理语音为当前接收的目标语音与在此之前接收到的目标语音的总和,所述待处理语音的数据与所述目标语音的数量相同;
对每个所述待处理语音进行语音识别,得到与各待处理语音对应的语音识别结果;
根据待处理语音的确定时间,将与最新确定的待处理语音对应的语音识别结果作为所述预处理结果。
2.根据权利要求1所述的方法,其特征在于,所述在所述当前单元语音的尾端静音的持续时长到达第一预设时间时,基于接收到的语音确定目标语音,将所述目标语音传输至语音识别服务器,包括:
当所述当前单元语音的尾端静音的持续时长到达第一预设时间时,确定所述尾端静音的持续时长到达第一预设时间时对应的时间为第一时间点,获取所述第一时间点之前未上传至所述语音识别服务器的语音,将获取的语音中首个单元语音的开始时间确定为第二时间点,根据所述第二时间点至第一时间点之间的语音确定目标语音,将所述目标语音上传至所述语音识别服务器。
3.根据权利要求1所述的方法,其特征在于,对所述当前单元语音执行的数据处理操作还包括:
如果在所述当前单元语音的尾端静音的持续时长超过第三预设时间但未到达第一预设时间时接收到其他单元语音,则持续接收其他单元语音,直至接收到的其他单元语音满足尾端静音的持续时长到达第一预设时间时,将满足尾端静音的持续时长到达第一预设时间的其他单元语音作为新的当前单元语音。
4.根据权利要求1所述的方法,其特征在于,对所述当前单元语音执行的数据处理操作还包括:
如果在所述当前单元语音的尾端静音的持续时长超过第一预设时间并且未到达第二预设时间时接收到其他单元语音,确定所述尾端静音到达第二预设时间时对应的时间为第二时间点、所述尾端静音后的首个单元语音的开始时间为第三时间点;根据所述第二时间点至所述第三时间点之间的语音确定目标语音;将所述目标语音上传至所述语音识别服务器;以及,
将所述尾端静音后的首个单元语音作为新的当前单元语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010111854.2/1.html,转载请声明来源钻瓜专利网。