[发明专利]用于增量地生成的语音识别假设的增强的稳定性预测在审
| 申请号: | 201280053938.9 | 申请日: | 2012-08-13 |
| 公开(公告)号: | CN103918026A | 公开(公告)日: | 2014-07-09 |
| 发明(设计)人: | I·C·麦格劳;A·H·格伦斯坦 | 申请(专利权)人: | 谷歌公司 |
| 主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/22 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 增量 生成 语音 识别 假设 增强 稳定性 预测 | ||
1.一种计算机实施的方法,包括:
接收各自表示增量语音识别器在不同时间点的顶端增量语音识别假设的多个部分增量语音识别假设;
从所述多个部分增量语音识别假设之一识别分段;
从所述多个部分增量语音识别假设确定所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久;并且
由一个或多个计算机基于所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久来向所述分段分配稳定性度量。
2.根据权利要求1所述的方法,其中向所述分段分配所述稳定性度量进一步基于所述分段的右侧上下文。
3.根据权利要求1所述的方法,其中所述分段包括词或子词。
4.根据权利要求1所述的方法,其中确定所述分段持续了多久包括确定所述分段在没有变化的情况下持续了多久。
5.根据权利要求1所述的方法,其中所述稳定性度量在所识别的、包括所述分段的特定增量语音识别假设从所述增量语音识别器输出之后被分配给所述分段。
6.根据权利要求1所述的方法,包括:
接收与话语相对应的音频信号;并且
对所述音频信号执行增量语音识别以生成所述多个部分增量语音识别假设。
7.根据权利要求1所述的方法,包括:
确定所述稳定性度量是否满足阈值;并且
基于确定所述稳定性度量是否满足所述阈值来改变用户界面上所述分段的表示的视觉特征。
8.根据权利要求1所述的方法,包括:
确定所述稳定性度量是否满足阈值,并且
基于确定所述稳定性度量是否满足所述阈值来将所述分段翻译为不同语言。
9.根据权利要求1所述的方法,包括:
确定所述稳定性度量是否满足阈值;并且
基于确定所述稳定性度量是否满足所述阈值来将所述分段作为搜索查询的一部分提交至搜索引擎。
10.根据权利要求1所述的方法,包括:
确定所述稳定性度量是否满足阈值;并且
基于确定所述稳定性度量是否满足所述阈值来在用户界面上显示所述分段的表示。
11.根据权利要求1所述的方法,其中所述接收、识别、确定和分配由一个或多个计算机来执行。
12.一种系统,包括:
一个或多个计算机以及存储指令的一个或多个存储设备,如果被所述一个或多个计算机执行,所述指令可操作为使得所述一个或多个计算机执行操作,所述操作包括:
接收各自表示增量语音识别器在不同时间点的顶端增量语音识别假设的多个部分增量语音识别假设;
从所述多个部分增量语音识别假设之一识别分段;
从所述多个部分增量语音识别假设确定所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久;并且
基于所述分段在没有变化的情况下在所述增量语音识别器的顶端增量语音识别假设中持续了多久来向所述分段分配稳定性度量。
13.根据权利要求12所述的系统,其中向所述分段分配所述稳定性度量进一步基于所述分段的右侧上下文。
14.根据权利要求12所述的系统,其中所述分段包括词或子词。
15.根据权利要求12所述的系统,其中确定所述分段持续了多久包括确定所述分段在没有变化的情况下持续了多久。
16.根据权利要求12所述的系统,其中所述稳定性度量在所识别的、包括所述分段的特定增量语音识别假设从所述增量语音识别器输出之后被分配给所述分段。
17.根据权利要求12所述的系统,其中所述操作包括:
接收与话语相对应的音频信号;并且
对所述音频信号执行增量语音识别以生成所述多个部分增量语音识别假设。
18.根据权利要求12所述的系统,其中所述操作包括:
确定所述稳定性度量是否满足阈值;并且
基于确定所述稳定性度量是否满足所述阈值来改变用户界面上所述分段的表示的视觉特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280053938.9/1.html,转载请声明来源钻瓜专利网。





