[发明专利]用于关键字检测的自适应音频帧处理有效
| 申请号: | 201480025428.X | 申请日: | 2014-04-24 |
| 公开(公告)号: | CN105229726B | 公开(公告)日: | 2019-04-02 |
| 发明(设计)人: | 李敏秀;金泰殊;黄奎雄;金圣雄;真珉豪 | 申请(专利权)人: | 高通股份有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/08 |
| 代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音特征 缓冲器 目标关键字 输入声音 自适应 关键字检测 移动装置 输入流 音频帧 检测 方差 跳过 标准化 统计 激活 进程 | ||
本发明揭示一种从输入声音检测目标关键字来激活移动装置中的功能的方法。在此方法中,从输入流提取声音特征,并生成(340)包含特定声音特征的均值和方差的统计。基于所述统计,当当前值与先前值之间的差异不显著时,所述方法自适应地跳过一声音特征的标准化,这具有降低进程负载的效果。详细地说,在缓冲器(330)中接收第一多个声音特征,且在所述缓冲器(330)中接收第二多个声音特征。当在所述缓冲器中接收到所述第二多个声音特征中的每一者时,从所述缓冲器处理第一数目个所述声音特征。所述第一数目个所述声音特征包含两个或多个声音特征。另外,所述方法包含为所述经处理的声音特征中的每一者确定关键字得分(360),以及在所述关键字得分中的至少一者大于阈值得分的情况下,将所述输入声音检测为所述目标关键字(370)。
本申请案主张共同拥有的2013年5月7日申请的第61/820,464号美国临时专利申请案、2013年7月26日申请的第61/859,048号美国临时专利申请案以及2013年12月10日申请的第14/102,097号美国非临时专利申请案的优先权,上述申请案中的每一者的内容以全文引用的方式明确地并入本文中。
技术领域
本发明大体上涉及移动装置中的语音辨识,且更明确地说,涉及处理输入声音来检测移动装置中的目标关键字。
背景技术
最近,例如智能电话和平板计算机等移动装置的使用已变得普遍。这些装置通常提供经由无线网络的话音和数据通信功能性。另外,此类移动装置通常包含提供为增强用户方便而设计的多种功能的其它特征。
正越来越多地使用的所述特征中的一者为话音助理功能。话音助理功能允许移动装置接收话音命令,并响应于所述话音命令而运行各种应用程序。举例来说,来自用户的话音命令允许移动装置呼叫所要的电话号码,播放音频文件,拍摄图片,搜索因特网,或获得天气信息,而无对移动装置的物理操纵。
在常规移动装置中,通常响应于从输入声音检测到目标关键字而激活话音助理功能。目标关键字的检测通常涉及从输入声音提取声音特征,以及一次使所述声音特征中的一个标准化。然而,以此方式循序地使所述声音特征标准化可能导致从输入声音检测目标关键字的延迟。另一方面,在具有有限电力供应的移动装置中,可立刻执行声音特征的标准化。然而,在此情况下,此标准化通常导致大量的进程负载,这要花费一些时间来返回到正常进程负载,同时耗尽电源。
发明内容
本发明提供用于从移动装置中的输入声音检测目标关键字的方法和设备。
根据本发明的一个方面,揭示一种从输入声音检测目标关键字以激活移动装置中的功能的方法。在此方法中,在缓冲器中接收第一多个声音特征,且在所述缓冲器中接收第二多个声音特征。当在所述缓冲器中接收到所述第二多个声音特征中的每一者时,从所述缓冲器处理第一数目个所述声音特征。所述第一数目个所述声音特征包含两个或多个声音特征。另外,所述方法可包含为所述经处理的声音特征中的至少一者确定关键字得分,以及在所述关键字得分中的至少一者大于阈值得分的情况下,将所述输入声音检测为目标关键字。本发明还描述设备、装置、系统、装置组合以及与此方法有关的计算机可读媒体。
根据本发明的另一方面,一种移动装置包含缓冲器、特征处理单元、关键字得分计算单元以及关键字检测单元。所述缓冲器经配置以存储第一多个声音特征和第二多个声音特征。所述特征处理单元经配置以处理来自缓冲器的第一数目个声音特征,而所述缓冲器接收第二多个声音特征中的每一者。所述第一数目个所述声音特征包含两个或多个声音特征。关键字得分计算单元经配置以为所述经处理的声音特征中的每一者确定关键字得分。如果所述关键字得分中的至少一者大于阈值得分,那么关键字检测单元经配置以将输入声音检测为目标关键字。
附图说明
当结合附图阅读时,将参考以下详细描述来理解本发明的发明性方面的实施例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480025428.X/2.html,转载请声明来源钻瓜专利网。





