[发明专利]信息处理装置和方法及程序在审
申请号: | 201980036326.0 | 申请日: | 2019-05-23 |
公开(公告)号: | CN112204507A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 福永大辅;田中义己;菅沼久浩;西牧悠二 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06T7/70;G06T7/00;G06T7/20;G10L15/28;G06F3/16 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 方法 程序 | ||
1.一种信息处理装置,包括:
控制单元,基于指示用户的方向的用户方向信息来结束声音输入接收状态。
2.根据权利要求1所述的信息处理装置,其中,所述控制单元基于所述用户方向信息来控制所述声音输入接收状态的开始和结束。
3.根据权利要求1所述的信息处理装置,其中,在满足基于所述用户方向信息的预定条件的情况下,所述控制单元结束所述声音输入接收状态。
4.根据权利要求3所述的信息处理装置,其中,在所述用户不面向特定位置的方向的情况下,所述控制单元认为满足所述预定条件。
5.根据权利要求3所述的信息处理装置,其中,在所述声音输入接收状态开始之后,在所述用户不面向特定位置的方向的状态的持续时间或累积时间超过阈值的情况下,所述控制单元认为满足所述预定条件。
6.根据权利要求3所述的信息处理装置,其中,在所述用户面向的方向与特定位置的方向之间的偏差超过阈值的情况下,所述控制单元认为满足所述预定条件。
7.根据权利要求3所述的信息处理装置,其中,在所述用户面向的方向既不是多个特定位置的方向中的任一方向也不是位于所述特定位置中的两个特定位置之间的方向的情况下,所述控制单元认为满足所述预定条件。
8.根据权利要求3所述的信息处理装置,还包括:
呈现单元,给出所述用户的方向偏离特定位置的方向的呈现。
9.根据权利要求2所述的信息处理装置,其中,所述控制单元在所述用户面向特定位置的方向的情况下建立所述声音输入接收状态。
10.根据权利要求9所述的信息处理装置,其中,一个或多个位置被指定为所述特定位置。
11.根据权利要求10所述的信息处理装置,其中,所述控制单元添加或删除被指定为所述特定位置的位置。
12.根据权利要求1所述的信息处理装置,其中,在已建立所述声音输入接收状态的情况下,当从通过声音收集而获得的声音信息中检测到话语区间时,控制单元开始声音识别。
13.根据权利要求12所述的信息处理装置,还包括:
缓冲器,保留所述声音信息,
其中,在已建立所述声音输入接收状态的情况下,当从被保留在所述缓冲器中的所述声音信息中检测到所述话语区间时,所述控制单元开始所述声音识别。
14.根据权利要求12所述的信息处理装置,其中,在所述声音输入接收状态中检测到所述话语区间的情况下,当面向特定位置的方向的所述用户给出话语时,所述控制单元开始所述声音识别。
15.根据权利要求14所述的信息处理装置,其中,所述控制单元基于对于图像的图像识别结果并且基于所述用户方向信息,来指定面向所述特定位置的方向的所述用户是否已经给出话语,所述图像包含作为对象的位于声音传来方向或位于周围的所述用户。
16.根据权利要求1所述的信息处理装置,其中,在已建立所述声音输入接收状态的情况下,所述控制单元使声音输入单元收集环境声音。
17.根据权利要求2所述的信息处理装置,其中,所述控制单元基于所述用户方向信息和来自声音信息中的预定词的检测结果,使所述声音输入接收状态开始,所述声音信息指示所收集的声音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980036326.0/1.html,转载请声明来源钻瓜专利网。