[发明专利]语音识别功率管理有效
申请号: | 201380064898.2 | 申请日: | 2013-12-09 |
公开(公告)号: | CN105009204B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 肯尼思·约翰·巴斯耶;休·埃文·塞克-瓦尔克;托尼·大卫;赖因哈德·克内泽尔;杰弗瑞·彭罗德·亚当斯;斯坦·魏德纳·萨尔瓦多;马赫什·克里希纳穆尔蒂 | 申请(专利权)人: | 亚马逊技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/78 |
代理公司: | 11112 北京天昊联合知识产权代理有限公司 | 代理人: | 顾丽波;李荣胜<国际申请>=PCT/US |
地址: | 美国内*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 功率 管理 | ||
计算装置的功耗可通过一个或多个关键字进行管理。例如,如果所述计算装置获得的音频输入包含关键字,那么所述计算装置的网络接口模块和/或应用处理模块可被启用。所述音频输入然后可经由所述网络接口模块传输到远程计算装置,诸如,语音识别服务器。或者,所述计算装置可配有语音识别引擎,所述语音识别引擎配置来处理所述音频输入以便进行装置上的语音识别。
背景技术
计算装置可包含语音识别能力。例如,计算装置可捕获音频输入并使用声学模型和语言模型来识别语音。声学模型用来生成假设,其中基于语音的声学特征,声音子字单元(例如,音素等)对应于语音。语言模型基于所说语音所用语言的词汇特征来确定使用声学模型生成的哪个假设最有可能是语音的抄本。计算装置也能够针对具体的语音识别应用来处理识别的语音。例如,有限的语法或自然语言处理技术可用来处理语音。
附图简述
参考以下详细说明,结合附图,将更易于了解、同时更好地理解本公开的各方面以及随之而来的很多优点,在附图中:
图1为描绘说明性功率管理子系统的示意图。
图2为描绘包括功率管理子系统的说明性用户计算装置的示意图。
图3为描绘用于语音识别功率管理的说明性例行程序的流程图,所述语音识别功率管理可由图1的功率管理子系统实施。
图4A、图4B和图4C为描绘分布式语音识别系统的说明性操作的状态图。
图5为描绘说明性用户接口的直观图,所述用户接口可由包括功率管理子系统的用户计算装置提供。
详细说明
在语音识别的一些当前方法中,语音识别能力被分配到分布式计算环境中的一个或多个计算装置上。在这些方法的一个具体实例中,第一计算装置可配置来捕获音频输入,并且可通过网络将音频输入传输到第二计算装置。第二计算装置可对音频输入执行语音识别,并且生成音频输入中包含的语音的抄本。语音的抄本随后可通过网络从第二计算装置传输回到第一计算装置。在其他当前方法中,第一计算装置可配置来捕获音频输入并独立地转录音频输入。
在这些和其他当前方法中,第一计算装置可配置来保持在持续活动状态。在这种持续活动状态下,第一计算装置可连续不断地维持到第二计算装置的网络连接。第一计算装置也可继续为用来实施自身的语音识别能力的任何硬件提供电力。这些方法的一个缺点尤其在于,第一计算装置用来维持持续活动状态而消耗的能量可能是无法接受的。对于依赖电池电力的移动计算装置而言,这种能量需求特别成问题。当前方法中还有其他问题。
因此,本公开的方面涉及语音识别的功率管理。计算装置可配有功率管理子系统,所述功率管理子系统选择性地启用或停用计算装置的一个或多个模块。此启用可响应于音频输入,所述音频输入包括一个或多个预先指定的所说字词,本文中有时称为“关键字”。促使启用一个或多个部件的关键字在本文中有时称为“唤醒字”,而促使停用一个或多个部件的关键字在本文中有时称为“休眠字”。在一个特定实例中,计算装置可包括选择性地启用的网络接口模块,所述网络接口模块在启用时会消耗能量以使得计算装置连接到第二计算装置,诸如,语音识别服务器或其他计算装置。功率管理子系统可处理音频输入以确定音频输入是否包含唤醒字,并且响应于确定音频输入包括唤醒字而启用网络接口模块。启用网络接口模块之后,功率管理子系统可使音频输入传输到语音识别服务器以进行处理。
功率管理子系统自身可包括一个或多个选择性地启用的模块。在一些实施例中,一个或多个选择性地启用的模块被实施为专用硬件(诸如集成电路、数字信号处理器或其他类型的处理器),其可从功能相对较少的低功率停用状态切换到功能相对较多的高功率启用状态,并且反之亦然。在其他实施例中,一个或多个模块被实施为软件,其包含由一个或多个通用处理器执行的计算机可执行代码。通过启用(或停用)通用处理器可启用(或停用)软件模块,所述通用处理器配置来或能够执行软件中包含的计算机可执行代码。在另外的实施例中,功率管理系统包括一个或多个硬件模块以及一个或多个软件模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚马逊技术有限公司,未经亚马逊技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380064898.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成负位线电压的电路
- 下一篇:有源振动噪声控制装置