[发明专利]具有关键词适配的可定制关键词定位系统在审

专利信息
申请号: 202080071838.3 申请日: 2020-08-26
公开(公告)号: CN114586094A 公开(公告)日: 2022-06-03
发明(设计)人: L.考希克;Z.葛 申请(专利权)人: 索尼互动娱乐股份有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/16;G10L15/187;G06F40/242;G10L15/02;G10L15/08;G10L15/22
代理公司: 北京市柳沈律师事务所 11105 代理人: 张晓明
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 具有 关键词 定制 定位 系统
【说明书】:

用户(202)可以指定针对数字助理(12)的唤醒词以触发数字助理对该唤醒词响应,其中该用户提供(204)该唤醒词的一个或多个初始发音。该唤醒词可以是唯一的,或者至少不是由所述数字助理的装置制造商或开发商事先确定的。然后可以用将来可能提供的唤醒词的其他潜在发音来扩充(214)该关键词的一个或多个初始发音,并且可以对那些其他潜在发音向下修剪(214)到阈值数量的其他潜在发音。然后可以使用该唤醒词的一个或多个初始发音的一个或多个记录来训练(218)音素识别器模型,以更好地识别所述用户或另一个人使用所述初始发音或其他潜在发音说出的所述唤醒词的未来实例。

技术领域

本申请总体上涉及技术上创新的非常规解决方案,这些解决方案必须源于计算机技术并产生具体的技术改进。特别地,本申请涉及使用神经网络和其他技术来识别唤醒词或其他关键词以触发数字助理响应,其中关键词不是预定的。

背景技术

唤醒词检测通常用于触发在装置处执行的数字助理以开始收听由人类口头提供且助理可能响应的任务或信息请求。助理可以包含在机器人、智能手机、智能扬声器等中,并且可以是例如亚马逊的或苹果的

然而,当前技术的局限性在于,典型地单一、预定义和通用的唤醒词(通常是给予助理的名字本身)缺乏个性化。该限制旨在使唤醒词的“关键词定位”在尝试检测实时语音中的唤醒词时尽可能准确,因为当前用于关键词定位的方法通常需要训练用于对从说出预定唤醒词的众多说话者的数千个训练样本进行关键词定位的神经网络,以将助理识别唤醒词的准确性提高到足够的水平。当前对于前述计算机相关技术问题没有妥善的解决方案。

发明内容

本申请认识到,在个性化机器人、通信对话代理和其他类型的数字助理呈指数增长的世界中,需要一种技术解决方案,其能够帮助用户为助理分配他们自己的唤醒词名字(或更一般地,关键词),并使用该名字来激活助理并与之对话。本申请还认识到不同的用户可能在不同的时间与相同的装置/数字助理互动,并且可能希望各自给相同的助理不同的唤醒词或名字。

基于前述,本申请进一步认识到可定制唤醒词/关键词定位可以在众多应用程序中实现和使用,而无需在说出关键词的不同人的成千上万个训练样本上训练神经网络。

因此,在与本发明原理一致的非限制性示例中,“可定制关键词定位”可以被认为是一种可训练的关键词定位方法,其具有通过在装置本地处无需服务器的帮助离线地注册特定的新关键词/唤醒词来添加新关键词/唤醒词的能力。助理然后可以开始再次无需服务器的帮助在连续实时和“离线”语音中检测新添加的关键词/唤醒词,以验证关键词已经被说出(但是在一些实施方案中服务器可以用于此类目的)。包含助理的系统/装置甚至可以在注册过程期间适用于说话者,以通过短期关键词适配的过程使系统更熟悉说话者的声音。这种关键词适配也可以在较短期和较长期使用说话者与助理的对话随时间的推移而执行,以改进系统检测说话者唤醒词的准确性。

更详细地,在示例实施方案中,可以检测人说出的音素,并且系统可以使用音素-关键词解码器来解码经由音素说出的关键词以检测关键词。为实现这一点,可以通过首先选择足够的数据集用于训练和评估模型并将其应用于关键词来开发音素识别器模型。例如,可以使用TIMIT语料库,因为其具有足够的带注释音素边界来训练高效的音素识别器模型,但是应理解可以使用多个其他语料库。根据本发明原理,可以使用基于循环神经网络的方法来训练音素识别器模型,并且在一些示例中,具体地可以使用基于联结主义时序分类(CTC)的翘曲方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼互动娱乐股份有限公司,未经索尼互动娱乐股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080071838.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top