[发明专利]基于检测到的手势和凝视调用自动化助理功能在审

专利信息
申请号: 201880094289.4 申请日: 2018-05-04
公开(公告)号: CN112236738A 公开(公告)日: 2021-01-15
发明(设计)人: 元·袁;肯尼斯·米克斯特;图安·恩古耶 申请(专利权)人: 谷歌有限责任公司
主分类号: G06F3/01 分类号: G06F3/01;G06F3/16;G06F3/03;G06F3/038
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 李宝泉;任庆威
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 检测 手势 凝视 调用 自动化 助理 功能
【权利要求书】:

1.一种由客户端设备的一个或多个处理器实现的方法,所述方法促进在一个或多个用户与自动化助理之间的无接触交互,所述方法包括:

接收基于来自所述客户端设备的一个或多个相机的输出的图像帧的流;

使用在本地存储在所述客户端设备上的至少一个训练后的机器学习模型来处理所述流的图像帧以监视以下两者的发生:

通过所述图像帧中的至少一个图像帧所捕获的用户的调用手势,和

所述用户的指向所述客户端设备的凝视;

基于所述监视,检测以下两者的发生:

所述调用手势,和

所述凝视;以及

响应于检测到所述调用手势和所述凝视两者的发生:

使所述自动化助理的至少一个功能被激活。

2.根据权利要求1所述的方法,其中,响应于检测到所述调用手势和所述凝视两者的发生而被激活的所述自动化助理的所述至少一个功能包括:

向与所述自动化助理相关联的远程服务器传送经由所述客户端设备的一个或多个麦克风所捕获的音频数据。

3.根据权利要求1或权利要求2所述的方法,其中,响应于检测到所述调用手势和所述凝视两者的发生而被激活的所述至少一个功能包括:

向与所述自动化助理相关联的远程服务器传送附加图像帧,所述附加图像帧基于来自所述相机中的一个或多个相机的输出并且在检测到所述调用手势和所述凝视两者的发生之后被接收。

4.根据任一前述权利要求所述的方法,其中,响应于检测到所述调用手势和所述凝视两者的发生而被激活的所述至少一个功能包括:

在所述客户端设备处处理缓冲的音频数据,所述缓冲的音频数据被存储在所述客户端设备处的存储器中并且是经由所述客户端设备的一个或多个麦克风来捕获的,并且处理所述缓冲的音频数据包括以下各项中的一者或两者:

调用短语检测处理,和

自动语音辨识。

5.根据权利要求4所述的方法,其中,处理所述缓冲的音频数据包括所述自动语音辨识,并且其中,所述自动语音辨识包括话音至文本处理。

6.根据权利要求4或权利要求5所述的方法,其中,处理所述缓冲的音频数据包括调用短语检测处理并且还包括:

响应于所述调用短语检测处理检测到在所述缓冲的音频数据中存在调用短语,执行以下各项中的一者或两者:

向与所述自动化助理相关联的远程服务器传送经由所述客户端设备的所述一个或多个麦克风捕获的另外的音频数据;以及

向与所述自动化助理相关联的远程服务器传送附加图像帧,所述附加图像帧基于来自所述相机中的一个或多个相机的输出并且在检测到所述调用手势和所述凝视两者的发生之后被接收。

7.根据任一前述权利要求所述的方法,其中,使用在本地存储在所述客户端设备上的至少一个训练后的机器学习模型来处理所述流的图像帧以监视所述调用手势和所述凝视两者的发生包括:

使用第一训练后的机器学习模型来监视所述调用手势的发生;以及

使用第二训练后的机器学习模型来监视所述用户的指向所述客户端设备的凝视。

8.根据权利要求7所述的方法,其中,使用所述第二训练后的机器学习模型来监视所述用户的指向所述客户端设备的凝视仅响应于使用所述第一训练后的机器学习模型检测到所述调用手势的发生而发生。

9.根据权利要求7或权利要求8所述的方法,其中,使用所述第一训练后的机器学习模型来监视所述调用手势的发生包括使用所述第一机器学习模型来处理所述图像帧的第一分辨率版本;并且其中,使用所述第二训练后的机器学习模型来监视所述用户的凝视包括使用所述第二机器学习模型来处理所述图像帧的第二分辨率版本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201880094289.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top