[发明专利]信息处理装置、信息处理方法以及程序在审
| 申请号: | 201980007295.6 | 申请日: | 2019-01-10 |
| 公开(公告)号: | CN111542876A | 公开(公告)日: | 2020-08-14 |
| 发明(设计)人: | 纲岛宣浩 | 申请(专利权)人: | 索尼公司 |
| 主分类号: | G10L15/10 | 分类号: | G10L15/10 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 王玉玺 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息处理 装置 方法 以及 程序 | ||
本发明使得能够更详细地掌握会话的状态。通过处理语音信号来检测共享会话的每个参与者的发言。通过处理图像信号来检测共享会话的每个参与者的状态,例如,每个参与者的注视方向。基于每个参与者的发声和状态来判定会话的状态和存在。因此,与仅基于参与者的发声来判定会话的状态和存在时相比,可以更精确地判定会话的状态和存在。
技术领域
本技术涉及信息处理装置、信息处理方法以及程序,并且更详细地,涉及用于掌握由多个参与者构建的会话(讨论、会议、群体工作、主动学习等)的情况的信息处理装置等。
背景技术
在会话中,掌握会话的情况是非常重要的。例如,专利文献1提出了记录并显示会话参与者的发言持续时间的技术。此外,例如,专利文献2提出了一种通过从由多个参与者佩戴的姓名标签型传感器获得的语音数据等掌握会话情况来呈现相关图的技术。这些技术能够通过加速度传感器来获取语音和诸如点头运动,但是这是不够的。
引文列表
专利文献
专利文献1:日本专利申请特开No.4-323689
专利文献2:日本专利申请特开No.2013-058221
发明内容
本发明要解决的问题
本技术的目的是允许更详细地掌握会话的情况。
问题的解决方案
本技术的概念是一种信息处理装置,包括:
语音处理单元,其从语音信号检测会话的多个参与者的发言;
图像处理单元,其从图像信号检测所述会话的所述多个参与者的状态;以及
判定单元,其基于所述多个参与者的发言和所述多个参与者的状态来判定所述会话的状态。
在本技术中,由语音处理单元从语音信号中检测会话的多个参与者的发言。此外,从图像信号检测会话的多个参与者的状态。然后,由判定单元基于多个参与者的发言和多个参与者的状态来判定会话的状态。
例如,会话的状态可以包括会话的参与者之间的会话关系。此外,例如,会话的状态可以包括发言的内容、发言的次数或发言的持续时间中的至少一项。另外,例如,会话的状态可以包括会话的建立。在这种情况下,例如,当参与者之一在看着会话的对方而正在说话时,可以判定会话已经建立。
例如,图像处理单元可以检测参与者之一正在看着的方向,作为参与者的状态之一。然后,在这种情况下,例如,图像处理单元可以从参与者之一的面部朝向或视线方向检测参与者之一正在看着的方向。
例如,当在第一参与者发言之后第二参与者发言并且第二参与者正在看的方向与第一个参与者的方向一致时,判定单元可以判定第一参与者与第二参与者之间存在会话。
如上所述,在本技术中,基于从语音信号检测到的会话的多个参与者的发言以及从图像信号检测到的会话的多个参与者的状态来判定会话的状态。因此,与仅通过参与者的发言来判定会话状态的技术相比,可以以更高的精度来判定会话状态。
注意,例如,本技术还可以包括图像生成单元,该图像生成单元生成用于会话的空间的平面地图图像,其中该平面地图图像可以包含示出参与会话的每个参与者的参与者显示,并且该平面地图图像可以包含基于检测到的会话连接对应的两个参与者显示的会话线。这使得可以例如从视觉上容易地识别谁与谁进行了会话。
例如,图像处理单元可以处理图像信号以进一步检测参与会话的每个参与者的位置,并且图像生成单元可以根据检测到的每个参与者的位置改变示出每个参与者的参与者显示在平面地图图像上的位置。这使得可以容易地在视觉上识别参与会话的每个参与者所处的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980007295.6/2.html,转载请声明来源钻瓜专利网。





