[发明专利]语音中关键词的检测方法和存储介质在审

专利信息
申请号: 202211435411.4 申请日: 2022-11-16
公开(公告)号: CN115810353A 公开(公告)日: 2023-03-17
发明(设计)人: 黄殿文;张冲;马煜坤;倪崇嘉;马斌 申请(专利权)人: 阿里巴巴达摩院(杭州)科技有限公司
主分类号: G10L15/20 分类号: G10L15/20;G10L15/06
代理公司: 北京博浩百睿知识产权代理有限责任公司 11134 代理人: 谢湘宁
地址: 310023 浙江省杭州市余杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 关键词 检测 方法 存储 介质
【说明书】:

本申请公开了一种语音中关键词的检测方法和存储介质。其中,该方法包括:采集监测到的待检测语音,其中,待检测语音中包含了需要检测的至少一目标关键词;调用关键词预测模型,其中,关键词预测模型为基于多个第一噪声增强样本之间的交叉熵损失进行监督学习,以及基于多个第二噪声增强样本之间的对比损失进行对比学习而训练生成,多个第一噪声增强样本为对第一语音样本进行混合数据增强而得到,不同第二噪声增强样本分别为对相同类型的多个第二语音样本进行混合数据增强而得到;使用关键词预测模型从待检测语音中提取出噪声增强特征;从待检测语音中去除噪声增强特征,以识别出目标关键词。本申请解决了对关键词进行检测的鲁棒性低的技术问题。

技术领域

本申请涉及计算机领域,具体而言,涉及一种语音中关键词的检测方法和存储介质。

背景技术

目前,关键词检测可以用于在给定的话语中检测预先确定的单词,比如,提前设定通过对手机发出命令,比如,“你好”时可以激活手机,则当在话语中检测到“你好”时,可以激活手机。

在相关技术中,是通过语音交互应用功能完成对给定话语中的单词进行检索,但是,上述方法依赖于干净或近距离交谈的音频集,在噪声环境下,精度下降,容易被错误激活,存在对关键词进行检测的鲁棒性低的技术问题。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种语音中关键词的检测方法和存储介质,以至少解决对关键词进行检测的鲁棒性低的技术问题。

根据本申请实施例的一个方面,提供了一种语音中关键词的检测方法和存储介质。该方法可以包括:采集监测到的待检测语音,其中,待检测语音中包含了需要检测的至少一目标关键词;调用关键词预测模型,其中,关键词预测模型为基于多个第一噪声增强样本之间的交叉熵损失进行监督学习,以及基于多个第二噪声增强样本之间的对比损失进行对比学习而训练生成,多个第一噪声增强样本为对第一语音样本进行混合数据增强而得到,不同第二噪声增强样本分别为对相同类型的多个第二语音样本进行混合数据增强而得到;使用关键词预测模型从待检测语音中提取出噪声增强特征;从待检测语音中去除噪声增强特征,以识别出目标关键词。

根据本申请实施例的另一个方面,提供了一种模型的确定方法。该方法可以包括:获取第一语音样本和多个第二语音样本,其中,多个第二语音样本的类型相同;对第一语音样本进行混合数据增强,得到多个第一噪声增强样本,且分别对相同类型的第二语音样本进行混合数据增强,得到多个第二噪声增强样本;确定多个第一噪声增强样本之间的交叉熵损失,以及确定多个第二噪声增强样本之间的对比损失;基于交叉熵损失对第一语音样本进行自监督学习,且基于对比损失对多个第二语音样本进行对比学习,得到关键词预测模型,其中,关键词预测模型用于从待检测语音中提取出噪声增强特征,以识别出待检测语音中的目标关键词。

根据本申请实施例的另一个方面,提供了另一种语音中关键词的检测方法和存储介质。该方法可以包括:采集向客户端发送的待检测语音,其中,待检测语音中包含了需要检测的至少一目标关键词;使用关键词预测模型从待检测语音中提取出噪声增强特征,其中,关键词预测模型为基于多个第一噪声增强样本之间的交叉熵损失进行监督学习,以及基于多个第二噪声增强样本之间的对比损失进行对比学习而训练生成,多个第一噪声增强样本为对第一语音样本进行混合数据增强而得到,不同第二噪声增强样本分别为对相同类型的多个第二语音样本进行混合数据增强而得到;从待检测语音中去除噪声增强特征,以识别出目标关键词;基于目标关键词激活客户端。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211435411.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top