[发明专利]基于仲裁的语音识别有效
申请号: | 201780077204.7 | 申请日: | 2017-10-18 |
公开(公告)号: | CN110073326B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 史蒂芬·贝克哈德;特德·林 | 申请(专利权)人: | 搜诺思公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L15/22 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 陈慧 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 仲裁 语音 识别 | ||
1.一种用于第一网络设备的方法,其中所述第一网络设备是通过通信装置进行通信式耦接的多个网络设备的一部分,所述多个网络设备至少包括所述第一网络设备和第二网络设备,所述方法包括:
检测第一语音输入;
确定第一置信度,所述第一置信度指示所述第一网络设备检测到所述第一语音输入的程度;
接收消息,所述消息包括第二置信度,所述第二置信度指示第二网络设备检测到所述第一语音输入的程度;
检测所述第一语音输入之后的第二语音输入;
当确定所述第一置信度大于所述第二置信度时,由所述第一网络设备将所述第二语音输入发送给服务器;
所述方法还包括在将所述第二语音输入发送给所述服务器之前等待时间间隔的到期,其中检测到所述第一语音输入将触发所述时间间隔的开始;以及
其特征在于,通过以下之一对所述时间间隔的持续时间进行操作:
根据连接到所述通信装置的网络设备的数量设置所述时间间隔的持续时间,使得当连接较少的网络设备时,所述时间间隔较短,而当连接较多的网络设备时,所述时间间隔较长;
基于所述网络设备彼此的接近度来设置所述时间间隔的所述持续时间,使得所述网络设备彼此之间越近,则所述时间间隔越短;以及
在两个网络设备没有将所述第二语音输入发送给所述服务器的情况下,基于旨在最小化所述时间间隔的学习算法来调整所述时间间隔的所述持续时间,所述学习算法包括:将所述时间间隔设置为初始值,并在确定了至少两个网络设备将所述第二语音输入发送给所述服务器时,增加所述时间间隔。
2.根据权利要求1所述的方法,其中所述第一语音输入是唤醒字。
3.根据权利要求1或2所述的方法,其中所述第二语音输入是以下中的一项:
对信息的请求;以及
用于修改媒体播放系统的播放设置的命令。
4.根据权利要求1或2所述的方法,其中,当所述第一置信度不大于所述第二置信度时,所述第一网络设备丢弃所接收的第二语音命令的记录。
5.根据权利要求1或2所述的方法,还包括由所述第一网络设备向耦合到所述通信装置的所述多个网络设备发送包括所述第一置信度的第二消息。
6.根据权利要求5所述的方法,其中一个或多个消息还包括以下中的至少一项:
对应于所述第一语音输入的唤醒字的标识符;
标识所述唤醒字的说话者的语音标识符;以及
指示所述第二网络设备在确定是否将所述第二语音输入发送给所述服务器之前将等待多久的时间间隔。
7.根据权利要求5所述的方法,还包括:
在时间间隔到期之前,接收包括相应置信度的一个或多个附加消息;以及
确定所述第一置信度是否大于在所述时间间隔到期之前接收的消息的所有置信度;并且
当所述第一置信度是所接收的置信度中的最大值时,在所述时间间隔到期时将所述第二语音输入发送给所述服务器。
8.根据权利要求1或2所述的方法,还包括:
从所述服务器接收对所述第二语音输入的语音响应;以及
可听见地播放所述语音响应。
9.根据权利要求1或2所述的方法,还包括响应于检测到所述第一语音输入来调整音频播放的音量。
10.根据权利要求9所述的方法,还包括另外使得正在播放所述音频的另一网络设备的音频播放音量与待调整的所述第一网络设备同步。
11.根据权利要求9所述的方法,还包括以下之一:
确定所述音频播放是音乐播放,其中响应于检测到所述语音输入而调整所述音频播放的所述音量包括:调低所述音乐播放的音量;以及
确定所述音频播放是音频书的播放,其中响应于检测到所述语音输入而调整所述音频播放的所述音量包括:暂停所述音频书的所述播放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于搜诺思公司,未经搜诺思公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780077204.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于校验图像数据的有效性的方法
- 下一篇:基于位置的设备和认证系统