[发明专利]用于增量地生成的语音识别假设的增强的稳定性预测在审

申请号：	201280053938.9	申请日：	2012-08-13
公开（公告）号：	CN103918026A	公开（公告）日：	2014-07-09
发明（设计）人：	I·C·麦格劳;A·H·格伦斯坦	申请（专利权）人：	谷歌公司
主分类号：	G10L15/08	分类号：	G10L15/08;G10L15/22
代理公司：	北京市金杜律师事务所 11256	代理人：	王茂华
地址：	美国加利***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于增量生成语音识别假设增强稳定性预测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种计算机实施的方法，包括：

接收各自表示增量语音识别器在不同时间点的顶端增量语音识别假设的多个部分增量语音识别假设；

从所述多个部分增量语音识别假设之一识别分段；

从所述多个部分增量语音识别假设确定所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久；并且

由一个或多个计算机基于所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久来向所述分段分配稳定性度量。

2.根据权利要求1所述的方法，其中向所述分段分配所述稳定性度量进一步基于所述分段的右侧上下文。

3.根据权利要求1所述的方法，其中所述分段包括词或子词。

4.根据权利要求1所述的方法，其中确定所述分段持续了多久包括确定所述分段在没有变化的情况下持续了多久。

5.根据权利要求1所述的方法，其中所述稳定性度量在所识别的、包括所述分段的特定增量语音识别假设从所述增量语音识别器输出之后被分配给所述分段。

6.根据权利要求1所述的方法，包括：

接收与话语相对应的音频信号；并且

对所述音频信号执行增量语音识别以生成所述多个部分增量语音识别假设。

7.根据权利要求1所述的方法，包括：

确定所述稳定性度量是否满足阈值；并且

基于确定所述稳定性度量是否满足所述阈值来改变用户界面上所述分段的表示的视觉特征。

8.根据权利要求1所述的方法，包括：

确定所述稳定性度量是否满足阈值，并且

基于确定所述稳定性度量是否满足所述阈值来将所述分段翻译为不同语言。

9.根据权利要求1所述的方法，包括：

确定所述稳定性度量是否满足阈值；并且

基于确定所述稳定性度量是否满足所述阈值来将所述分段作为搜索查询的一部分提交至搜索引擎。

10.根据权利要求1所述的方法，包括：

确定所述稳定性度量是否满足阈值；并且

基于确定所述稳定性度量是否满足所述阈值来在用户界面上显示所述分段的表示。

11.根据权利要求1所述的方法，其中所述接收、识别、确定和分配由一个或多个计算机来执行。

12.一种系统，包括：

一个或多个计算机以及存储指令的一个或多个存储设备，如果被所述一个或多个计算机执行，所述指令可操作为使得所述一个或多个计算机执行操作，所述操作包括：

接收各自表示增量语音识别器在不同时间点的顶端增量语音识别假设的多个部分增量语音识别假设；

从所述多个部分增量语音识别假设之一识别分段；

从所述多个部分增量语音识别假设确定所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久；并且

基于所述分段在没有变化的情况下在所述增量语音识别器的顶端增量语音识别假设中持续了多久来向所述分段分配稳定性度量。

13.根据权利要求12所述的系统，其中向所述分段分配所述稳定性度量进一步基于所述分段的右侧上下文。

14.根据权利要求12所述的系统，其中所述分段包括词或子词。

15.根据权利要求12所述的系统，其中确定所述分段持续了多久包括确定所述分段在没有变化的情况下持续了多久。

16.根据权利要求12所述的系统，其中所述稳定性度量在所识别的、包括所述分段的特定增量语音识别假设从所述增量语音识别器输出之后被分配给所述分段。

17.根据权利要求12所述的系统，其中所述操作包括：

接收与话语相对应的音频信号；并且

对所述音频信号执行增量语音识别以生成所述多个部分增量语音识别假设。

18.根据权利要求12所述的系统，其中所述操作包括：

确定所述稳定性度量是否满足阈值；并且

基于确定所述稳定性度量是否满足所述阈值来改变用户界面上所述分段的表示的视觉特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于谷歌公司，未经谷歌公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201280053938.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种纳米PtPd合金材料表面的聚乙烯砒咯烷酮的清洗方法
下一篇：在润滑的媒介中操作的摩擦部件

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于增量地生成的语音识别假设的增强的稳定性预测在审

专利文献下载