[发明专利]用户专用的自动语音识别在审
申请号: | 201280071506.0 | 申请日: | 2012-03-16 |
公开(公告)号: | CN104488025A | 公开(公告)日: | 2015-04-01 |
发明(设计)人: | T·沃尔夫;M·布克;T·豪利克;苏哈迪 | 申请(专利权)人: | 纽昂斯通讯公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜;王英 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 专用 自动 语音 识别 | ||
1.一种用于自动语音识别(ASR)的设备,包括:
采用至少一个硬件实现的计算机处理器的多模式声音控制的用户接口,其中所述用户接口适用于与一个或多个可能的说话者进行语音对话,并且包括:
a.广泛倾听模式,其不使用空间过滤,从所述可能的说话者接收语音输入;和
b.选择性倾听模式,其使用空间过滤,将语音输入限制到特定说话者;
其中所述用户接口响应于一个或多个切换提示,切换倾听模式。
2.如权利要求1所述的设备,其中所述广泛倾听模式使用相关联的广泛模式识别词汇表,所述选择性倾听模式使用不同的、相关联的选择性模式识别词汇表。
3.如权利要求1所述的设备,其中所述切换提示包括来自于所述语音输入的一个或多个模式切换词。
4.如权利要求1所述的设备,其中所述切换提示包括在所述语音对话中的一个或多个对话状态。
5.如权利要求1所述的设备,其中所述切换提示包括来自于所述可能的说话者的一个或多个视觉提示。
6.如权利要求1所述的设备,其中所述选择性倾听模式使用声学说话者定位以用于所述空间过滤。
7.如权利要求1所述的设备,其中所述选择性倾听模式使用图像处理以用于所述空间过滤。
8.如权利要求1所述的设备,其中在选择性倾听模式中,对于多个被选择的说话者中的每一个而言,所述用户接口同时并行操作。
9.如权利要求1所述的设备,其中所述接口适用于在这两个倾听模式中并行操作,由此,所述接口在所述广泛倾听模式中接收来自于房间内任何用户的语音输入,与此同时在所述选择性倾听模式中,接收仅来自于一个被选择说话者的语音输入。
10.一种在非暂时性计算机可读介质中编码的、用于操作自动语音识别(ASR)系统的计算机程序产品,所述产品包括:
用于经由多模式声音控制的用户接口与一个或多个可能的说话者进行语音对话的程序代码,所述用户接口适用于:
a.在广泛倾听模式中,不使用空间过滤,从所述可能的说话者接收语音输入;以及
b.在选择性倾听模式中,使用空间过滤,将语音输入限制到特定说话者;
其中所述用户接口响应于一个或多个切换提示,切换倾听模式。
11.一种用于自动语音识别(ASR)的设备,包括:
采用至少一个硬件实现的计算机处理器的声音控制的用户接口,其中所述用户接口适用于与一个或多个可能的说话者进行语音对话;以及
与所述用户接口进行通信的用户选择模块,所述用户选择模块用于基于对所述可能的说话者的图像处理,使用空间过滤来限制所述用户接口,以便仅响应来自于一个特定说话者的语音输入。
12.如权利要求11所述的设备,其中所述空间过滤进一步基于多个麦克风的选择性的波束成形。
13.如权利要求11所述的设备,其中所述用户接口进一步适用于提供视觉反馈以指示所述特定说话者的方向。
14.如权利要求11所述的设备,其中所述用户接口进一步适用于提供视觉反馈以指示所述特定说话者的身份。
15.如权利要求11所述的设备,其中所述图像处理包括执行所述可能的说话者的视觉图像的手势识别。
16.如权利要求11所述的设备,其中所述图像处理包括执行所述可能的说话者的面部的视觉图像的面部识别。
17.一种在非暂时性计算机可读介质中编码的、用于操作自动语音识别(ASR)系统的计算机程序产品,所述产品包括:
用于声音控制的用户接口的程序代码,所述用户接口适用于与一个或多个可能的说话者进行语音对话;以及
用于与所述用户接口进行通信的用户选择模块的程序代码,所述用户选择模块用于基于对所述可能的说话者的图像处理,使用空间过滤来限制所述用户接口,以便仅响应来自于一个特定说话者的语音输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纽昂斯通讯公司,未经纽昂斯通讯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280071506.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:声音处理系统
- 下一篇:篡改明显栓体安全密封件