[发明专利]经由标识信息的语音识别分析有效
| 申请号: | 201110031166.6 | 申请日: | 2011-01-21 |
| 公开(公告)号: | CN102136269A | 公开(公告)日: | 2011-07-27 |
| 发明(设计)人: | J·弗莱克斯;D·霍金斯;C·克莱恩;M·S·德尼斯;T·莱瓦德;A·M·瓦塞尔;D·麦克凯 | 申请(专利权)人: | 微软公司 |
| 主分类号: | G10L15/00 | 分类号: | G10L15/00;G06K9/00;A63F13/10 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 杨洁;钱静芳 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 经由 标识 信息 语音 识别 分析 | ||
1.一种在包括麦克风阵列和图像传感器的计算系统中操作语音识别输入系统的方法(300),所述方法包括:
接收(302)语音识别数据,所述语音识别数据包括所识别的语音段、经由来自所述麦克风阵列的信号确定的与所述所识别的语音段的起源位置有关的声学位置数据、以及包括识别置信值的置信数据;
接收(312)包括与位于所述图像传感器的视场中的每个人的位置有关的视觉位置信息的图像数据;
将所述声学位置数据与所述视觉位置数据进行比较(316)来确定所述所识别的语音段是否源自所述图像传感器的所述视场中的人;以及
基于所述所识别的语音段是否被确定为源自所述图像传感器的所述视场中的人来调整(318)所述置信数据。
2.如权利要求1所述的方法,其特征在于,调整所述置信数据包括降低所述识别置信值。
3.如权利要求1所述的方法,其特征在于,调整所述置信数据包括确定被配置成传达所述所识别的语音段是否来自活动用户的置信水平的预期输入置信值。
4.如权利要求1所述的方法,其特征在于,还包括基于所述所识别的语音段是否被确定为源自所识别的说话者来调整所述置信数据。
5.如权利要求1所述的方法,其特征在于,如果所述所识别的语音段被确定为不是源自所识别的说话者并且被确定为不是源自所述图像传感器的所述视场中的人,则调整所述置信数据包括拒绝所述所识别的语音段。
6.如权利要求1所述的方法,其特征在于,如果确定所述所识别的语音段源自所述图像传感器的所述视场中的人,则在随后确定所述人的脸部是否面向所述图像传感器,并且基于所述人的脸部是否面向所述图像传感器来调整所述置信数据。
7.如权利要求1所述的方法,其特征在于,还包括在接收所述所识别的语音段之前接收关键词的语音输入,并且其中调整所述置信数据包括基于在接收到所述关键词的语音输入和接收到所述所识别的语音段之间经过的时间量来调整所述置信数据。
8.如权利要求1所述的方法,其特征在于,所述图像传感器是深度感测照相机,并且其中接收包含视觉位置信息的图像数据包括接收包含与所述深度感测照相机的所述视场中的每个人的距离有关的信息的图像数据。
9.一种交互式娱乐系统(200),包括:
深度感测照相机(202);
包括多个麦克风的麦克风阵列(204)以及
计算设备(102),所述计算设备包括处理器(210)和其上包含有指令的存储器(212),所述指令可以由所述处理器执行以:
接收包括语音识别数据,所述语音识别数据包括所识别的语音段、经由来自所述麦克风阵列(204)的信号确定的与所识别的语音段的起源位置有关的声学位置数据、以及包括识别置信值的置信数据;
接收包括与位于所述深度感测照相机(202)的视场中的每个人的位置有关的视觉位置信息的图像数据;
将所述声学位置数据与所述视觉位置数据进行比较以确定所述所识别的语音段是否源自所述深度感测照相机(202)的所述视场中的人;以及
基于所述所识别的语音段是否被确定为源自所述深度感测照相机(202)的所述视场中的人来调整所述置信数据。
10.如权利要求9所述的交互式娱乐系统,其特征在于,所述指令可被执行来通过降低所述识别置信值来调整所述置信数据。
11.如权利要求9所述的交互式娱乐系统,其特征在于,所述指令可被执行来通过确定并包括被配置成传达所述所识别的语音段是否来自活动用户的置信水平的预期输入置信值来调整所述置信数据。
12.如权利要求9所述的交互式娱乐系统,其特征在于,所述指令还可被执行以:
确定所述所识别的语音段是否源自所识别的说话者,以及
基于所述所识别的语音段被确定为源自所识别的说话者来调整所述置信数据。
13.如权利要求12所述的交互式娱乐系统,其特征在于,所述指令还可被执行以执行以下动作:如果所述所识别的语音段被确定为不是源自所识别的说话者并且所述所识别的语音段被确定为不是源自所述深度感测照相的所述视场中的人,则拒绝所述所识别的语音段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110031166.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:混凝土灌注设备及方法
- 下一篇:直线共轭内啮合齿轮泵
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





