[发明专利]情景地消除查询的歧义在审
申请号: | 201711049727.9 | 申请日: | 2017-10-31 |
公开(公告)号: | CN108628919A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | I.拜德尔;N.格里姆斯莫;G.H.巴基尔;K.阿尼基;A.库马尔;V.库兹涅佐夫 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子图像 标签 情景 转录 计算装置 搜索查询 歧义 图像 计算机存储介质 计算机程序 系统和设备 标签指示 图像识别 文本识别 查询 关联地 显示器 话语 输出 | ||
1.一种计算机实现的方法,包括:
接收在计算装置的显示器上呈现的图像和由所述计算装置的用户所说出的话语的转录;
识别包含在所述图像中的特定子图像;
基于在所述特定子图像上进行图像识别,确定一个或多个第一标签,所述一个或多个第一标签指示所述特定子图像的情景;
基于在所述图像的除了所述特定子图像之外的区域上进行文本识别,确定一个或多个第二标签,所述一个或多个第二标签指示所述特定子图像的情景;
基于所述转录、所述第一标签和所述第二标签,生成搜索查询;以及
提供所述搜索查询用于输出。
2.如权利要求1所述的方法,其中,生成所述搜索查询包括以所述第一标签或者所述第二标签中的一个或多个替换所述转录的术语。
3.如前述权利要求中任一项所述的方法,包括:
为所述第一标签和所述第二标签中的每一个生成标签置信度,所述标签置信度指示所述标签对应于所述特定子图像的用户主要感兴趣的部分的可能性;以及
基于所述相应的标签置信度,选择所述第一标签和所述第二标签中的一个或多个,
其中,基于一个或多个所选择的第一标签和第二标签,生成所述搜索查询。
4.如前述权利要求中任一项所述的方法,其中,生成搜索查询包括:
存取历史查询数据,所述历史查询数据包含由其他用户提供的先前的搜索查询;
基于所述转录、所述第一标签和所述第二标签,生成一个或多个候选搜索查询;
将所述历史查询数据与所述一个或多个候选搜索查询相比较;以及
基于将所述历史查询数据与所述一个或多个候选搜索查询相比较,从所述一个或多个候选搜索查询中选择所述搜索查询。
5.如权利要求1至3中任一项所述的方法,还包括:
基于所述转录、所述第一标签和所述第二标签,生成一个或多个候选搜索查询;
为所述一个或多个候选搜索查询中的每一个确定查询置信度,所述查询置信度指示所述候选搜索查询是所述转录的准确重写的可能性;以及
基于所述查询置信度,选择特定候选搜索查询作为所述搜索查询。
6.如前述权利要求中任一项所述的方法,其中,识别包含在所述图像中的所述特定子图像包括:
识别包含在所述图像中的一个或多个子图像;
为包含在所述图像中的所述一个或多个子图像中的每一个生成图像置信度,所述图像置信度指示子图像为用户主要感兴趣的可能性;以及
基于所述一个或多个子图像的图像置信度,选择所述特定子图像。
7.如权利要求1至5中任一项所述的方法,其中,识别包含在所述图像中的所述特定子图像包括在所述计算装置处接收数据,所述数据指示控制事件的选择,所述控制事件识别所述特定子图像。
8.如前述权利要求中任一项所述的方法,其中,所述计算装置配置为响应于检测到预定的热词来捕获所述图像并捕获对应于所述话语的音频数据。
9.如前述权利要求中任一项所述的方法,包括:
接收附加图像和由所述计算装置的用户所说出的附加话语的附加转录,所述附加图像对应于所述计算装置的所述显示器的至少另一部分;
识别包含在所述附加图像中的附加特定子图像;
基于在所述附加特定子图像上进行图像识别,确定一个或多个附加第一标签,所述一个或多个附加第一标签指示所述附加特定子图像的情景;
基于在所述附加图像的除了所述附加特定子图像之外的部分上进行文本识别来确定一个或多个附加第二标签,所述一个或多个附加第二标签指示所述附加特定子图像的情景;
基于所述附加转录、所述附加第一标签和所述附加第二标签来生成命令;以及
执行所述命令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711049727.9/1.html,转载请声明来源钻瓜专利网。