[发明专利]服务器及语音识别方法在审
申请号: | 202110335864.9 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113053380A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 胡帆;雷将;徐侃 | 申请(专利权)人: | 海信电子科技(武汉)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L21/0208;G10L15/04;H04N21/472;H04N21/422 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 430073 湖北省武汉市东湖新技术开发*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 语音 识别 方法 | ||
1.一种服务器,其特征在于,所述服务器被配置为:
接收来自显示设备的语音分片数据;
若所述语音分片数据不是语音会话的最后一片数据,根据服务器未向语音识别服务设备发送所述语音分片数据的上一片数据,暂不发送所述语音分片数据,直到所述服务器已发送所述上一片数据,或所述上一片数据被标记为忽略状态,再将所述语音分片数据发送给所述语音识别服务设备;
若所述语音分片数据是所述最后一片数据,在所述最后一片数据之前的非忽略状态的语音分片数据均已发送,或等待的时间超过预设时间阈值时,再将已接收还未发送、且未被标记为忽略状态的语音分片数据发送给语音识别服务设备。
2.根据权利要求1所述的服务器,其特征在于,所述服务器还被配置为:
对于未接收到的语音分片数据,若接收到排序在后的语音分片数据的数量达到预设数量阈值,将所述未接收到的语音分片数据标记为忽略状态。
3.根据权利要求1所述的服务器,其特征在于,所述服务器还被配置为:
对于未接收到且未被标记为忽略状态的语音分片数据,若距离所述最后一片数据的顺序越近,则所述语音分片数据对应的预设等待时间越大,所述预设时间阈值为全部预设等待时间中的最大值。
4.根据权利要求1所述的服务器,其特征在于,所述语音分片数据包括语音数据和分片参数,所述分片参数包括分片序号,所述分片序号用于确定所述语音分片数据在语音会话中的顺序。
5.根据权利要求3所述的服务器,其特征在于,所述分片序号包括数组,所述数组包括两个数值,所述数组的第一个数值表示所述语音分片数据在语音会话中的顺序,所述数组的第二个数值表示所述语音分片数据的下一分片数据在所述语音会话中的顺序。
6.根据权利要求3所述的服务器,其特征在于,所述分片序号表示所述语音分片数据在语音会话中的顺序,最后一片数据的分片参数还包括所述语音会话的结束标识。
7.根据权利要求1所述的服务器,其特征在于,所述服务器还被配置为:
从接收到所述语音会话的第一片数据开始,检测最后一次接收到语音分片数据的时间距与当前时间的差值是否大于预设超时阈值,若大于,则确定所述语音会话已结束。
8.根据权利要求7所述的服务器,其特征在于,所述检测最后一次接收到语音分片数据的时间距与当前时间的差值是否大于预设超时阈值,包括:每隔预设周期检测最后一次接收到语音分片数据的时间距与当前时间的差值是否大于预设超时阈值。
9.根据权利要求1所述的服务器,其特征在于,所述服务器还被配置为:
在接收到所述语音分片数据后,将所述语音分片数据存储到所述语音会话对应的缓存文件中。
10.一种语音识别方法,其特征在于,包括:
显示设备将语音分片数据发送给服务器;
服务器接收来自显示设备的语音分片数据;
若所述语音分片数据不是语音会话的最后一片数据,所述服务器根据未向语音识别服务设备发送所述语音分片数据的上一片数据,暂不发送所述语音分片数据,直到所述服务器已发送所述上一片数据,或所述上一片数据被标记为忽略状态,再将所述语音分片数据发送给所述语音识别服务设备;
若所述语音分片数据是所述最后一片数据,所述服务器在所述最后一片数据之前的非忽略状态的语音分片数据均已发送,或等待的时间超过预设时间阈值时,再将已接收还未发送、且未被标记为忽略状态的语音分片数据发送给所述语音识别服务设备;
所述语音识别服务设备根据接收到的语音分片数据进行实时语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信电子科技(武汉)有限公司,未经海信电子科技(武汉)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110335864.9/1.html,转载请声明来源钻瓜专利网。