[发明专利]用于利用语音开始检测来唤醒短语检测的双管线体系结构在审

申请号：	201980018936.8	申请日：	2019-02-22
公开（公告）号：	CN111868825A	公开（公告）日：	2020-10-30
发明（设计）人：	维克托·西米利斯基;罗伯特·措普夫	申请（专利权）人：	赛普拉斯半导体公司
主分类号：	G10L15/28	分类号：	G10L15/28;G10L15/18;G10L25/87
代理公司：	北京安信方达知识产权代理有限公司 11262	代理人：	陆建萍;杨明钊
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于利用语音开始检测唤醒短语双管体系结构
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

短语检测设备包括：将音频数据的第一部分从音频数据源传送到处理单元的高时延管线，其中高时延管线包括存储音频数据的第一部分的历史缓冲器；以及以比高时延管线更低的时延将音频数据的第二部分从音频数据源传送到处理单元的低时延管线。与音频数据源耦合的声音开始检测器基于音频数据来检测声音开始事件。与高时延管线和低时延管线耦合的同步电路响应于声音开始事件而使存储在历史缓冲器中的音频数据的第一部分到处理单元的输出和音频数据的第二部分经由低时延管线到处理单元的输出同步。

相关申请

本申请是于2018年6月5日提交的美国非临时申请号16/000,102的国际申请，其要求于2018年3月12日提交的美国临时申请号62/641,753的优先权和利益，所有这些申请特此通过引用被全部并入本文。

技术领域

本公开涉及语音(speech)识别的领域，且尤其是涉及语音开始和唤醒短语(phrase)检测。

背景

越来越多的现代计算设备以语音识别能力为特征，允许用户通过话音命令和自然语音来执行各种各样的计算任务。诸如移动电话或智能扬声器之类的设备提供了集成的虚拟助理，其可以通过在局域网和/或广域网上通信来对用户的命令或自然语言请求做出响应，以检索所请求的信息或以控制其他设备(例如灯、加热和空调控制器、音频或视频设备等)。具有语音识别能力的设备常常保持在低功耗模式中，直到特定的词或短语(即，唤醒短语)被说出为止，这允许用户在设备被这样激活之后使用话音命令来控制设备。

然而，由于设备的一部分(包括麦克风和一些语音检测电路)在长时间段内保持在通电状态中，唤醒短语检测的实现方式导致增加的功耗。此外，用于执行唤醒短语检测的附加电路可能增加时延，其表现为当一般语音识别在进行中时的较慢的响应时间。

附图简述

本公开在附图的图中通过示例的方式而不是通过限制的方式被示出。

图1是根据一个实施例的计算系统的框图。

图2根据一个实施例示出了短语检测电路的框图。

图3A根据一个实施例示出了用于使数据流与历史缓冲器同步的方法。

图4根据一个实施例示出了用于在计算系统中执行唤醒短语检测的过程的流程图。

详细描述

下面的描述阐述了许多特定细节，例如特定系统、部件、方法等的示例，以便提供对所主张的主题的若干实施例的良好理解。然而对本领域中的技术人员将明显的是，至少一些实施例可在没有这些特定细节的情况下被实践。在其他实例中，众所周知的部件或方法未被详细描述或以简单框图形式呈现，以便避免使所主张的主题不必要地模糊。因此，所阐述的特定细节仅仅是示例性的。特定的实现方式可相对于这些示例性细节变化，并且仍然被设想为在所主张的主题的范围内。

对于支持语音识别的设备，唤醒短语检测(WUPD)技术的实现方式允许设备的主要处理元件的功率选通，主要处理元件被维持在低功耗状态(例如睡眠状态)中直到唤醒短语被检测到为止。在一个实施例中，WUPD本身利用大量的功率和处理资源，且因此也通过比WUPD消耗更少功率的语音开始检测(SOD)或噪声阈值电平分析器(NTLA)技术被选通。当SOD或NTLA电路检测到语音开始事件时，WUPD电路被激活(即，转换到更高的功耗状态)以确定唤醒短语是否已经被说出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于赛普拉斯半导体公司，未经赛普拉斯半导体公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201980018936.8/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于利用语音开始检测来唤醒短语检测的双管线体系结构在审

专利文献下载