[发明专利]闪避和擦除来自附近设备的音频在审
| 申请号: | 201880035354.6 | 申请日: | 2018-08-28 |
| 公开(公告)号: | CN110678922A | 公开(公告)日: | 2020-01-10 |
| 发明(设计)人: | 肯尼斯·约翰·玛凯;尼基塔·古普塔;托默·谢凯尔 | 申请(专利权)人: | 谷歌有限责任公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;H04R29/00;H04S7/00;G06F3/16 |
| 代理公司: | 11219 中原信达知识产权代理有限责任公司 | 代理人: | 李佳;邓聪惠 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 智能家居设备 附近设备 音频控制系统 音频流 音频控制信号 语音交互 语音命令 发送 关联 音频流数据 麦克风 音量水平 音频设备 音频输出 集合 语音 输出 检测 响应 配置 | ||
1.一种计算机实现的方法,包括:
由主要计算设备检测一个或者多个辅助计算设备,所述一个或者多个辅助计算设备被配置为在环境中生成用于可听输出的音频流,其中,所述主要计算设备和所述一个或者多个辅助计算设备经由网络通信地耦合;
当确定这种辅助计算设备能够提供由所述主要计算设备可听地检测到的音频流时,由所述主要计算设备将所述一个或者多个辅助计算设备中的至少一个辅助计算设备分类为附近设备;
由所述主要计算设备发起语音交互模式,所述语音交互模式用于操作所述主要计算设备以接收来自用户的语音命令并且响应于所述语音命令而提供音频输出;以及
由所述主要计算设备向每个附近设备发送音频信号,所述音频信号在所述主要计算设备正在所述语音交互模式下操作的同时将所述附近设备配置为减少与由所述附近设备生成的所述音频流相关联的音量水平。
2.根据权利要求1所述的计算机实现的方法,进一步包括:由所述主要计算设备从用户接收被所述主要计算设备确定为与模式发起命令相匹配的语音命令;以及其中,响应于接收到被确定为与所述模式发起命令相匹配的所述语音命令,实施由所述主要计算设备发起用于操作所述主要计算设备的语音交互模式。
3.根据权利要求1或者2所述的计算机实现的方法,其中,由所述主要计算设备将所述一个或者多个辅助计算设备中的至少一个辅助计算设备分类为附近设备包括:确定与所述一个或者多个辅助计算设备相关联的位置标识符和与所述主要计算设备相关联的位置标识符相匹配。
4.根据任何一项前述权利要求所述的计算机实现的方法,其中,由所述主要计算设备将所述一个或者多个辅助计算设备中的至少一个辅助计算设备分类为附近设备包括:
由所述主要计算设备经由所述网络获得与由所述一个或者多个辅助计算设备中的每个辅助计算设备针对可听输出而生成的当前音频流相关联的音频流数据;
由所述主要计算设备经由麦克风获得在所述主要计算设备处接收到的当前音频样本;以及
由所述主要计算设备将由所述一个或者多个辅助计算设备中的每个辅助计算设备针对可听输出而生成的所述当前音频流与在所述主要计算设备处接收到的所述当前音频样本相比较。
5.根据权利要求4所述的计算机实现的方法,进一步包括:
由所述主要计算设备经由所述网络获得与由所述一个或者多个辅助计算设备中的每个辅助计算设备针对可听输出而生成的所述当前音频流相关联的时间戳;以及
由所述主要计算设备估计在与所述主要计算设备相关联的系统时钟和与所述一个或者多个辅助计算设备中的每个辅助计算设备相关联的系统时钟之间的时钟偏移;以及
其中,所述时钟偏移至少部分地用于由所述主要计算设备将由所述一个或者多个辅助计算设备中的每个辅助计算设备针对可听输出而生成的所述当前音频流与在所述主要计算设备处接收到的所述当前音频样本相比较。
6.根据权利要求4或者5所述的计算机实现的方法,进一步包括:由所述主要计算设备修改所述当前音频样本以减少所述当前音频样本中的与由所述一个或者多个辅助计算设备中的每个辅助计算设备针对可听输出而生成的所述当前音频流对应的部分。
7.根据权利要求6所述的计算机实现的方法,其中,在由所述主要计算设备发起用于操作所述主要计算设备的所述语音交互模式之前实施由所述主要计算设备修改所述当前音频样本,使得在对所述当前音频样本进行分析以便检测预定模式发起命令之前,所述当前音频样本具有来自每个附近设备的减少的音频贡献。
8.根据权利要求6所述的计算机实现的方法,其中,在由所述主要计算设备发起用于操作所述主要计算设备的所述语音交互模式之后实施由所述主要计算设备修改所述当前音频样本,使得在对所述当前音频样本进行分析以在所述语音交互模式下操作的同时确定来自用户的语音命令之前,所述当前音频样本具有来自每个附近设备的减少的音频贡献。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880035354.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:来自智能扬声器的动态文本到语音响应
- 下一篇:用于处理音频数据的系统和方法





