[发明专利]用于语音使能设备的动态唤醒词在审
| 申请号: | 202011343264.9 | 申请日: | 2020-11-26 |
| 公开(公告)号: | CN112927683A | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 莫伯耐 | 申请(专利权)人: | 声音猎手公司 |
| 主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22;G10L15/30;G10L15/06;G10L15/02 |
| 代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 姜飞 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 语音 设备 动态 唤醒 | ||
本公开涉及用于语音使能设备的动态唤醒词。公开了一种能够将口头话语解析成自然语言请求和语音音频段的系统和方法,其中所述自然语言请求指示所述系统使用所述语音音频段作为新唤醒词。响应于此唤醒词指派指令,所述系统和方法进一步能够立即构建新唤醒词侦测器,以在与输入音频中的所述新唤醒词匹配时激活所述设备。描述了用于迅速地构建新唤醒词侦测器的不同方法。唤醒词指派指令的变型可使新唤醒词成为公用的或私有的。它们也可将新唤醒词添加到较早的唤醒词,或者替换较早的唤醒词。
技术领域
本技术涉及用于语音使能设备的唤醒词,并且具体涉及使用自然语言查询来指派动态唤醒词,并且立即为用于用户的语音使能设备中的一个或多个的唤醒词构建唤醒词侦测器(spotter)。
背景技术
识别人类语音的自动语音识别(ASR)系统以及提取语音的含义的自然语言理解(NLU)能力一起提供了巨大的潜力作为用于与语音使能设备交互的一种简单自然的方式。此类系统部分地由现代设备中可用的大量计算和通信资源来实现。已经开发了能够识别各式各样的语音并且处理不同语言和方言的复杂请求的高级语音理解系统,诸如虚拟助理。
虚拟助理在空闲时不对口头请求做出响应。它们在接收到激活信号时唤醒或激活,并且将状态从空闲切换为活动,激活信号诸如轻敲、按钮按压或被称为唤醒词(或唤醒短语)的口头激活短语。唤醒词的使用是语音使能设备的关键免手和免眼操作。在活动状态下,虚拟助理对用户请求做出响应。它们在对请求做出响应之后通常返回到空闲状态。当空闲时,语音使能设备连续地监视传入音频以检测唤醒词。为了降低功耗,当虚拟助理空闲时,一些设备可以在低功率模式下操作;当被激活时,它们返回到全功率模式。
唤醒词通常是词或简短短语。监视传入音频以检测唤醒词的连续操作模块被称作唤醒词侦测器。用于语音使能设备的唤醒词的各种商业实现方式包括“Hey,Siri(嘿,Siri)”、“OK,Google(好的,谷歌)”和“Alexa”。语音使能设备可以与工厂安装的唤醒词和准备好检测预定义唤醒词的唤醒词侦测器一起被出售。
唤醒词侦测器是被专门设计来在连续音频流中检测一个指派的唤醒词或一组指派的唤醒词的音频处理算法。该算法通常以固定帧速率连续地运行,并且它必须是高度有效的。在处于低功率模式的设备上,侦测器能够连续地运行而不汲取过多电力,从而节省电池寿命。
有时可能期望在一个或多个语音使能设备上定制工厂安装的唤醒词。例如,在家庭或办公室环境中,可能存在使用相同工厂安装的唤醒词作为激活短语的多个设备。这可能导致错误的设备激活,或者导致多个设备在感测到公用唤醒词时激活的冲突。取决于跟在唤醒词之后的请求的类型,多个设备激活可能导致各种问题。例如,播放音乐的请求可导致多个设备同时播放相同的歌曲(不同步)或不同的歌曲。发送消息的请求可导致消息的多个副本被发送。这些和其他冲突场景导致较差的用户体验。
提供动态唤醒词时的关键挑战是在非常短的时间内训练新唤醒词侦测器。通常使用音频样本的大型数据集来训练工厂安装的唤醒词侦测器,这些音频样本包括针对一个或多个给定唤醒词专门记录的肯定实例,并且可能包括一些否定实例。此类标记样本用于训练分类器算法,诸如递归神经网络,以将给定唤醒词(或多个唤醒词)与音频流中的非唤醒词语音区分开。遗憾的是,用于收集音频样本数据的传统方法不可用于动态唤醒词,动态唤醒词需要在不用收集动态唤醒词的音频样本的大型数据集的情况下立即构建侦测器。
发明内容
根据本公开的一方面,提供了一种修改语音使能设备的一个或多个唤醒词的集合的方法。该方法包括:从用户接收口头请求;将所述口头请求解析成自然语言请求和语音音频段,其中所述自然语言请求指示所述设备接受所述语音音频段作为新唤醒词;以及构建新唤醒词侦测器,以识别所述新唤醒词作为激活触发器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于声音猎手公司,未经声音猎手公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011343264.9/2.html,转载请声明来源钻瓜专利网。





