[发明专利]降低对手动开始/结束点和触发短语的需求有效
| 申请号: | 201510289544.9 | 申请日: | 2015-05-29 |
| 公开(公告)号: | CN105320726B | 公开(公告)日: | 2019-08-20 |
| 发明(设计)人: | P·P·皮埃尔诺特;J·G·宾德尔 | 申请(专利权)人: | 苹果公司 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953;G10L15/22 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 罗亚男 |
| 地址: | 美国加*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 降低 手动 开始 结束 触发 短语 需求 | ||
本公开涉及降低对手动开始/结束点和触发短语的需求。提供了用于选择性处理和响应语音用户输入的系统和处理。在一个示例中,能在用户设备处接收包含语音用户输入的音频输入。能通过识别语音用户输入的开始点和结束点来从音频输入识别语音用户输入。能基于上下文信息确定语音用户输入是否针对虚拟助理。能使用基于规则的系统或概率系统来进行确定。如果确定语音用户输入意图针对虚拟助理,则能处理语音用户输入并且能生成合适的响应。相反如果确定语音用户输入不意图针对虚拟助理,则能忽视语音用户输入和/或可不生成响应。
技术领域
这总体涉及语音处理,更具体地,涉及使用上下文数据选择性处理语音用户输入。
背景技术
智能自动助理(或虚拟助理)提供用户与电子之间的直观交互。这些助理能允许用户以语音和/或文本形式使用自然语言与设备或系统交互。例如,用户能通过向与电子设备相关联的虚拟助理提供语音用户输入来访问电子设备的服务。虚拟助理能从语音用户输入解读用户的意图,并且将用户的意图实施为任务。然后可通过执行电子设备的一个或多个功能执行任务并且可将相关输出以自然语音形式返回用户。
为了使虚拟助理适当处理并响应语音用户输入,虚拟助理能首先使用一般称为开始点和结束点的处理分别识别音频输入流内的语音用户输入的开始和结束。传统的虚拟助理能基于接收的音频流的能量等级和/或声学特性或者用户的手动识别来识别这些点。例如,一些虚拟助理能需要用户通过在向虚拟助理说话之前按下物理或虚拟按钮或者通过在向虚拟助理说话之前以自然语言形式说出特定触发短语来输入开始点标识符。响应于接收到这些开始点标识符中的一个,虚拟助理能将随后接收的音频解读为语音用户输入。尽管能使用这些技术来清楚地识别针对虚拟助理的语音用户输入,但以此方式与虚拟助理交互对于用户可能是不自然或困难的。例如,在虚拟助理与用户之间的来回对话中,可能需要用户在各个语音用户输入之前输入开始点标识符(例如按下按钮或重复相同触发短语)。
发明内容
公开了用于操作虚拟助理的系统和处理。一个示例处理能包括在电子设备处接收音频输入,监视音频输入以识别第一语音用户输入,识别音频输入中的第一语音用户输入,以及基于与第一语音用户输入相关联的上下文信息确定是否响应第一语音用户输入。处理还能包括,响应于确定响应第一语音用户输入:生成对第一语音用户输入的响应;以及监视音频输入以识别第二语音用户输入。处理还能包括,响应于确定不响应第一语音用户输入,监视音频输入以识别第二语音用户输入而不生成对第一语音用户输入的响应。
附图说明
图1说明能根据各种示例操作的虚拟助理的示例性环境。
图2说明根据各种示例的示例性用户设备。
图3说明根据各种示例的用于使用上下文信息选择性处理和响应语音用户输入的示例性处理。
图4说明根据各种示例的用于使用上下文信息选择性处理和响应语音用户输入的另一示例性处理。
图5说明根据各种示例的配置为使用上下文信息选择性处理和响应语音用户输入的电子设备的功能框图。
具体实施方式
在下面的示例描述中,参考通过说明方式示出可以实现的特定示例的附图。要理解,在不脱离各种示例的范围的情况下,可以使用其它示例,并且可以进行结构改变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510289544.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:源处的数据收集和清洗
- 下一篇:跨区域相似车辆检索方法及装置





