[发明专利]低延迟智能自动化助理在审
申请号: | 201880030830.5 | 申请日: | 2018-04-24 |
公开(公告)号: | CN110612567A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | A·阿塞罗;章贺鹏 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G06F17/27;G10L25/78 |
代理公司: | 11602 北京市汉坤律师事务所 | 代理人: | 陈新;吴丽丽 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务流 数字助理 结束点条件 结果呈现 置信度 语音 自然语言处理 语音合成 语音识别 低延迟 流参数 流处理 检测 鲁棒 对话 | ||
1.一种用于操作数字助理的方法,所述方法包括:
在具有一个或多个处理器和存储器的电子设备处:
接收音频流,包括:
从第一时间到第二时间,接收所述音频流的包含用户话语的至少一部分的第一部分;以及
从所述第二时间到第三时间,接收所述音频流的第二部分;
确定所述音频流的所述第一部分是否满足预定条件;
响应于确定所述音频流的所述第一部分满足预定条件,在所述第二时间和所述第三时间之间至少部分地执行包括以下的操作:
基于所述用户话语的所述至少一部分的一个或多个候选文本表示,确定所述用户话语的所述至少一部分的多个候选用户意图,其中所述多个候选用户意图中的每个候选用户意图对应于多个候选任务流中的相应候选任务流;
选择所述多个候选任务流中的第一候选任务流;以及
执行所述第一候选任务流而不向所述设备的用户提供输出;
确定在所述第二时间和所述第三时间之间是否检测到语音结束点条件;并且
响应于确定在所述第二时间和所述第三时间之间检测到语音结束点条件,向所述用户呈现来自执行所选择的第一候选任务流的结果。
2.根据权利要求1所述的方法,还包括:
响应于确定在所述第二时间和所述第三时间之间未检测到语音结束点条件,放弃将所述结果呈现给所述用户。
3.根据权利要求1至2中任一项所述的方法,还包括:
确定所述音频流的所述第二部分是否包含所述用户话语的继续,其中响应于以下将所述结果呈现给所述用户:
确定所述音频流的所述第二部分不包含所述用户话语的继续;并且
确定在所述第二时间和所述第三时间之间检测到语音结束点条件。
4.根据权利要求3所述的方法,还包括:
响应于确定所述音频流的所述第二部分包含所述用户话语的继续,放弃将所述结果呈现给所述用户。
5.根据权利要求3至4中任一项所述的方法,还包括:
响应于确定所述音频流的所述第二部分包含所述用户话语的继续:
从所述第三时间到第四时间,接收所述音频流的第三部分;
确定所述音频流的所述第二部分是否满足预定条件;
响应于确定所述音频流的所述第二部分满足预定条件,在所述第三时间和第四时间之间至少部分地执行包括以下的操作:
基于所述音频流的所述第一部分和所述第二部分中的所述用户话语的第二多个候选文本表示,确定所述用户话语的第二多个候选用户意图,其中所述第二多个候选用户意图中的每个第二候选用户意图对应于第二多个候选任务流中的相应第二候选任务流;
选择所述第二多个候选任务流中的第二候选任务流;并且
执行所选择的第二候选任务流而不向所述用户提供输出。
6.根据权利要求5所述的方法,还包括:
确定在所述第三时间和所述第四时间之间是否检测到语音结束点条件;并且
响应于确定在所述第三时间和所述第四时间之间检测到语音结束点条件,向所述用户呈现来自执行所选择的第二候选任务流的第二结果。
7.根据权利要求1至6中任一项所述的方法,其中所述预定条件包括在所述音频流的所述第一部分中检测所述用户话语的所述至少一部分之后的长于第一预定持续时间的用户语音缺失的条件。
8.根据权利要求7所述的方法,其中检测所述语音结束点条件包括在所述音频流的所述第二部分中检测大于第二预定持续时间的用户语音缺失,并且其中所述第二预定持续时间长于所述第一预定持续时间。
9.根据权利要求1至8中任一项所述的方法,其中所述预定条件包括以下条件:在所述音频流的所述第一部分中检测在所述用户话语的所述至少一部分之后的长于第一预定持续时间的小于预定阈值能量水平的音频能量水平。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880030830.5/1.html,转载请声明来源钻瓜专利网。