[发明专利]扬声器识别和不受支持的扬声器适配技术有效
申请号: | 201580046288.9 | 申请日: | 2015-08-27 |
公开(公告)号: | CN106796791B | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | Y·金;S·S·卡加克卡 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L17/04;G10L17/06 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;张宁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 扬声器 识别 不受 支持 技术 | ||
本申请提供了用于生成用于执行针对虚拟助理的扬声器识别的扬声器配置文件的系统和过程。一种示例性过程可包括接收包括用户语音的音频输入以及基于针对预先确定的用户的扬声器配置文件确定用户语音的扬声器是否为预先确定的用户。响应于确定用户语音的扬声器为预先确定的用户,可将用户语音添加到扬声器配置文件并且可触发虚拟助理的操作。响应于确定用户语音的扬声器不是预先确定的用户,可将用户语音添加到另选的扬声器配置文件并且可不触发虚拟助理的操作。在一些示例中,可使用上下文信息来验证扬声器识别过程产生的结果。
相关申请的交叉引用
本申请要求2014年9月30日提交的题为“SPEAKER IDENTIFICATION ANDUNSUPERVISED SPEAKER ADAPTATION TECHNIQUES”的美国临时申请No.62/057,990和2015年8月25日提交的题为“SPEAKER IDENTIFICATION AND UNSUPERVISED SPEAKERADAPTATION TECHNIQUES”的美国非临时申请No.14/835,169的优先权,其全文出于所有目的以引用方式并入本文。
技术领域
本申请通常涉及自然语言处理,尤其涉及执行针对自然语言处理的扬声器识别。
背景技术
智能自动助理(或虚拟助理)在用户和电子设备之间提供直观的界面。这些助理可允许用户使用语言和/或文本形式的自然语言与设备或系统交互。例如,用户可通过将自然语言形式的语音用户输入提供给与电子设备相关联的虚拟助理来访问电子设备的服务。虚拟助理可对语音用户输入执行自然语言处理以推断用户意图并将用户意图操作为任务。随后可通过执行电子设备的一个或多个功能执行任务,并且可将相关输出以自然语言形式返回到用户。
一些自然语言处理系统可执行扬声器识别来验证用户的身份。这些系统典型地需要用户执行注册过程,在注册过程期间用户说出一系列预先确定的字词或短语来允许自然语言处理系统对用户语音建模。尽管此过程可用来有效地对用户语音建模,但是如果用户在注册过程期间以非自然方式说出和/或如果用户在不同于稍后执行扬声器识别的声学环境下执行注册过程,则该过程可能会产生不可靠的结果。因此,希望用于对用户语音建模的改进过程。
发明内容
本申请提供了用于生成用于执行针对虚拟助理的扬声器识别的扬声器配置文件的系统和过程。一种示例性过程可包括接收包括用户语音的音频输入以及基于针对预先确定的用户的扬声器配置文件确定用户语音的扬声器是否为预先确定的用户。响应于确定用户语音的扬声器为预先确定的用户,可将用户语音添加到扬声器配置文件并且可触发虚拟助理的操作。响应于确定用户语音的扬声器不是预先确定的用户,可将用户语音添加到另选的扬声器配置文件并且可不触发虚拟助理的操作。在一些示例中,可使用上下文信息来验证扬声器识别过程产生的结果。
附图说明
图1示出了根据各种示例的虚拟助理可操作的示例性环境。
图2示出了根据各种示例的示例性用户设备。
图3示出了根据各种示例的用于操作虚拟助理的示例性过程。
图4示出了根据各种示例的用于在扬声器配置文件生成模式操作虚拟助理的示例性过程。
图5示出了根据各种示例的用于在扬声器配置文件修改模式操作虚拟助理的示例性过程。
图6示出了根据各种示例的用于在静态扬声器配置文件模式操作虚拟助理的示例性过程。
图7示出了根据各种示例的用于执行扬声器识别的示例性过程。
图8示出了根据各种示例的配置为基于语音用户输入生成扬声器配置文件的电子设备的功能框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580046288.9/2.html,转载请声明来源钻瓜专利网。