[发明专利]多个语音识别设备之间的协调有效
| 申请号: | 201810500648.3 | 申请日: | 2018-05-23 |
| 公开(公告)号: | CN108962258B | 公开(公告)日: | 2023-08-15 |
| 发明(设计)人: | B.D.汤姆森 | 申请(专利权)人: | 哈曼国际工业有限公司 |
| 主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/02;G10L15/22 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 高巍 |
| 地址: | 美国康*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 设备 之间 协调 | ||
1.一种用于在包括多个语音识别设备VRD的VRD网络中处理基于话语的命令的方法,所述方法包括由所述多个VRD中每一个执行以下步骤:
生成与已经在本地检测到的话语事件相关联的一组特征,所述一组特征包括从所述话语事件中识别出的说话内容;
将所述一组特征和相关联的元数据发送给网络中的其他VRD,其中所述元数据与所述说话内容相关联;
从网络中的其他VRD中的每一个接收与由那个VRD检测到的所述话语事件相关联的第二组特征,其中所述第二组特征包括从由那个VRD检测到的所述话语事件中识别的第二说话内容;
基于所述一组特征与所述第二组特征之间的比较来确定响应于所述话语事件的动作应当由网络中的VRD中的一个确定的VRD在本地执行,其中所述确定包括确定所述说话内容与所述第二说话内容匹配;以及
由所述网络中的VRD中的所述确定的VRD在本地执行所述动作。
2.根据权利要求1所述的方法,其中所述一组特征包括对应于所述话语事件的本地检测到的音频信号的频率,并且其中确定响应于所述话语事件的所述动作应当在本地执行包括确定所述频率落入与人类话语相关联的频率范围内。
3.根据权利要求1所述的方法,其中所述一组特征包括对应于所述话语事件的本地检测到的音频信号的能量测量,并且所述第二组特征包括对应于所述话语事件的外部检测到的音频信号的第二能量测量,并且其中确定响应于所述话语事件的所述动作应当在本地执行包括确定所述本地检测到的音频信号的所述能量测量大于所述外部检测到的音频信号的所述第二能量测量。
4.根据权利要求1所述的方法,其中所述一组特征包括对应于所述话语事件的本地检测到的音频的质量测量,并且所述第二组特征包括对应于所述话语事件的外部检测到的音频的第二质量测量,并且其中确定响应于所述话语事件的所述动作应当在本地执行包括确定所述本地检测到的音频的所述质量测量高于所述外部检测到的音频的所述第二质量测量。
5.根据权利要求1所述的方法,其中所述一组特征包括对应于在本地检测到所述话语事件时的时间戳,并且所述第二组特征包括对应于在所述网络中的其他VRD检测到所述话语事件时的时间戳,并且其中确定响应于所述话语事件的所述动作应当在本地执行包括:基于所述时间戳来确定在所述网络中的其他VRD检测到所述话语事件之前本地检测到所述话语事件。
6.根据权利要求1所述的方法,其中所述一组特征包括与从本地检测到的所述话语事件中识别的说话内容相关联的置信度分数,并且所述第二组特征包括与从所述网络中的其他VRD检测到的所述话语事件中识别的说话内容相关联的第二置信度分数,并且其中确定响应于所述话语事件的动作应当在本地执行包括:确定所述本地检测到的音频的所述置信度分数高于所述第二置信度分数。
7.根据权利要求1所述的方法,其中所述一组特征包括与从所述话语事件中识别出的说话内容相关联的置信度分数,并且其中确定响应于所述话语事件的动作应当在本地执行包括:确定所述置信度分数大于阈值。
8.根据权利要求1所述的方法,还包括由所述多个VRD中的每一个执行以下步骤:
生成与已经在本地检测到的第二话语事件相关联的第三组特征;
从所述网络中的多个VRD中的每一个接收与由那个VRD检测到的所述第二话语事件相关联的第四组特征;
基于所述第三组特征与所述第四组特征之间的比较来确定响应于所述话语事件的动作应当由所述网络中的所述其他VRD中的一个执行;以及
终止对所述第二话语事件的本地处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈曼国际工业有限公司,未经哈曼国际工业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810500648.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在线互动直播回音消除系统
- 下一篇:处理方法及第一电子设备





