[发明专利]信息处理装置、信息处理系统、信息处理方法和程序在审
申请号: | 201880084925.5 | 申请日: | 2018-11-16 |
公开(公告)号: | CN111587413A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 河野真一;滝祐平;岩濑広 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06F3/0481;G06F3/16;G10L15/22 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 系统 方法 程序 | ||
通过生成并使用其中收集了多个用户语音实例的语音收集列表,本发明实现了一种能够基于多个用户语音实例精确且重复地执行处理的装置和方法。学习处理单元生成语音收集列表,其中,收集对应于多个不同处理请求的多个用户语音实例。此外,在显示单元上显示生成的语音收集列表。在诸如当获得用户同意或者确定对应于用户语音的多个处理的执行已经成功时或者当多个用户语音实例的组合达到或超过预定阈值或者推断用户满意时等情况下,所述学习处理单元生成语音收集列表并且将语音收集列表存储在存储单元中。
技术领域
本公开涉及一种信息处理装置、一种信息处理系统、一种信息处理方法和一种程序。更具体地,本公开涉及一种根据用户话语执行处理的信息处理装置、信息处理系统和信息处理方法以及程序。
背景技术
近年来,已经越来越多地使用语音交互系统,其执行用户话语的语音识别,并基于识别结果执行各种处理和响应。
那些语音识别系统识别并理解通过麦克风输入的用户话语,并根据该识别和理解执行处理。
例如,在用户说出“显示感兴趣的运动图像”的情况下,语音识别系统执行从运动图像内容提供服务器获取运动图像内容并将运动图像内容输出到显示单元或连接的电视机的处理。或者,在用户说出“关掉电视”的情况下,语音识别系统执行例如关闭电视的操作。
通用语音交互系统具有例如自然语言理解功能,例如,自然语言理解(NLU),并且通过应用自然语言理解(NLU)功能来理解用户话语的意图。
然而,例如,为了使语音交互系统连续执行多个处理,用户需要执行对应于多个处理的多个用户话语。例如,一个示例如下。
“显示一个感兴趣的运动图像(moving image)。”
“播放古典音乐。”
“我想继续玩昨天停止的游戏。”
“我想和我的朋友玩游戏,所以请联系他们。”
例如,在做出这种连续的用户话语的情况下,用户很难立即确认系统是否能够理解并执行所有这些话语。
实际上,用户需要在发出话语之后等待一段时间,以基于执行结果来确认是否响应于用户话语执行了处理。
在没有执行处理的情况下,需要执行关于没有执行的处理的重复话语的处理、关于该处理的重复话语的处理或其他处理。
这种响应给用户带来了沉重的负担。此外,完成这些处理所需时间的增加是有问题的。
公开了用于基于用户话语安全地执行处理请求的配置的相关技术是例如专利文献1(日本专利申请公开号2007-052397)。该文献公开了一种配置,其中,在显示单元上预先显示可以输入到汽车导航系统的语音命令的列表,使得用户可以在查看该列表的同时输入语音命令。
这种配置使得能够使用户发出汽车导航系统能够理解的用户话语(命令)。因此,可以降低执行汽车导航系统不能理解的用户话语(命令)的可能性。
这种配置可以将用户话语与系统中登记的命令相匹配。然而,如上所述,为了使配置连续执行多个处理请求,用户需要从列表中搜索与用户想要的多个处理相对应的多个命令。这增加了用户的负担。此外,结果,出现了完成这些处理所需的时间增加的问题。
引文目录
专利文献
专利文献1:日本专利申请公开号2007-052397
发明内容
本发明要解决的问题
考虑到例如上述问题,已经构成了本公开,并且其目的是提供一种能够更安全地根据用户话语执行处理的信息处理装置、信息处理系统、信息处理方法以及程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880084925.5/2.html,转载请声明来源钻瓜专利网。