[发明专利]一种机器人唤醒的语音关键词识别方法、装置及存储介质有效

专利信息
申请号: 202010302037.5 申请日: 2020-04-16
公开(公告)号: CN111508475B 公开(公告)日: 2022-08-09
发明(设计)人: 翟懿奎;张裕婷;柯琪锐;周文略;应自炉;徐颖 申请(专利权)人: 五邑大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/16;G10L15/26;G10L19/04;G10L21/0264
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 孙浩
地址: 529000 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 机器人 唤醒 语音 关键词 识别 方法 装置 存储 介质
【说明书】:

发明公开了一种机器人唤醒的语音关键词识别方法、装置及存储介质,包括:获取语音样本并进行语音增强,得到语音增强样本;对所述语音增强样本进行分帧处理,得到语音帧;对所述语音帧进行去噪处理,得到语音样本特征;将所述语音样本特征输入到深度神经网络模型进行训练,深度神经网络模型的输出层的每个神经单元得到后验概率;将所述后验概率组合成后验概率序列,将所述后验概率序列与预设阈值概率序列进行比较,确定输入语音的关键词;克服了数据较少或不平衡、受环境噪声影响造成关键词识别鲁棒性较低的问题,提高了语音关键词识别的准确率,从而提高了唤醒机器人的工作效率。

技术领域

本发明涉及人工智能领域,特别涉及一种机器人唤醒的语音关键词识别方法、装置及存储介质。

背景技术

语音关键词识别技术作为语音识别的重要分支在20世纪90年代逐渐被重视起来,时至今日,语音关键词识别技术除了应用在常见的智能家居的机器人唤醒与服务、餐饮行业的点餐与服务中,还可以应用在一些如今涉及比较少的领域,例如行政服务的满意度评价、校园暴力的安全预警、商场服务的评价与改进等,应用前景广阔。尽管如此,语音关键词识别技术尚未成熟,导致无法准确地进行人机互动,影响用户体验。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种机器人唤醒的语音关键词识别方法,克服了数据较少或不平衡、受环境噪声影响造成关键词识别鲁棒性较低的问题,提高了语音关键词识别的准确率,从而提高了唤醒机器人的工作效率。

本发明还提出一种应用上述机器人唤醒的语音关键词识别方法的机器人唤醒的语音关键词识别装置。

本发明还提出一种应用上述机器人唤醒的语音关键词识别方法的机器人唤醒的语音关键词识别存储介质。

根据本发明第一方面实施例的机器人唤醒的语音关键词识别方法,包括:

获取语音样本并进行语音增强,得到语音增强样本;

对所述语音增强样本进行分帧处理,得到语音帧;

对所述语音帧进行去噪处理,得到语音样本特征;

将所述语音样本特征输入到深度神经网络模型进行训练,所述深度神经网络模型的输出层的每个神经单元得到后验概率;

将所述后验概率组合成后验概率序列,将所述后验概率序列与预设阈值概率序列进行比较,确定输入语音的关键词。

根据本发明实施例的机器人唤醒的语音关键词识别方法,至少具有如下有益效果:通过语音增强可有效缓解因数据不平衡或者太少而造成的训练效果差或者无法训练等问题;同时去噪处理可有效减少环境噪声对关键词识别造成的影响,具有对不同噪声环境的良好鲁棒性,提高了关键词识别的正确率,从而提高了唤醒机器人的工作效率。

根据本发明的一些实施例,所述语音增强,包括:

将所述语音样本转换为PCM格式,并分为若干段音频;

利用SouthTouch音频处理库估算每段音频音轨的稳定节拍率;

保持音轨稳定节拍率,调节音频的节拍和音调;

结合采样率转换与时间拉伸,将若干段调整后的音频重新组合。

根据本发明的一些实施例,对所述语音帧进行去噪处理,得到语音样本特征,包括:利用堆栈式胶囊自动编码器对所述语音帧进行去噪处理;其中,所述堆栈式胶囊自动编码器包括部件胶囊自动编码器和目标胶囊自动编码器。

根据本发明的一些实施例,利用堆栈式胶囊自动编码器对所述语音帧进行去噪处理,得到语音样本特征,包括:

利用所述部件胶囊自动编码器学习预测所述语音帧的组成部分;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五邑大学,未经五邑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010302037.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top