[发明专利]一种机器人唤醒的语音关键词识别方法、装置及存储介质有效

申请号：	202010302037.5	申请日：	2020-04-16
公开（公告）号：	CN111508475B	公开（公告）日：	2022-08-09
发明（设计）人：	翟懿奎;张裕婷;柯琪锐;周文略;应自炉;徐颖	申请（专利权）人：	五邑大学
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/16;G10L15/26;G10L19/04;G10L21/0264
代理公司：	广州嘉权专利商标事务所有限公司 44205	代理人：	孙浩
地址：	529000 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种机器人唤醒语音关键词识别方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种机器人唤醒的语音关键词识别方法、装置及存储介质，包括：获取语音样本并进行语音增强，得到语音增强样本；对所述语音增强样本进行分帧处理，得到语音帧；对所述语音帧进行去噪处理，得到语音样本特征；将所述语音样本特征输入到深度神经网络模型进行训练，深度神经网络模型的输出层的每个神经单元得到后验概率；将所述后验概率组合成后验概率序列，将所述后验概率序列与预设阈值概率序列进行比较，确定输入语音的关键词；克服了数据较少或不平衡、受环境噪声影响造成关键词识别鲁棒性较低的问题，提高了语音关键词识别的准确率，从而提高了唤醒机器人的工作效率。

技术领域

本发明涉及人工智能领域，特别涉及一种机器人唤醒的语音关键词识别方法、装置及存储介质。

背景技术

语音关键词识别技术作为语音识别的重要分支在20世纪90年代逐渐被重视起来，时至今日，语音关键词识别技术除了应用在常见的智能家居的机器人唤醒与服务、餐饮行业的点餐与服务中，还可以应用在一些如今涉及比较少的领域，例如行政服务的满意度评价、校园暴力的安全预警、商场服务的评价与改进等，应用前景广阔。尽管如此，语音关键词识别技术尚未成熟，导致无法准确地进行人机互动，影响用户体验。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提出一种机器人唤醒的语音关键词识别方法，克服了数据较少或不平衡、受环境噪声影响造成关键词识别鲁棒性较低的问题，提高了语音关键词识别的准确率，从而提高了唤醒机器人的工作效率。

本发明还提出一种应用上述机器人唤醒的语音关键词识别方法的机器人唤醒的语音关键词识别装置。

本发明还提出一种应用上述机器人唤醒的语音关键词识别方法的机器人唤醒的语音关键词识别存储介质。

根据本发明第一方面实施例的机器人唤醒的语音关键词识别方法，包括：

获取语音样本并进行语音增强，得到语音增强样本；

对所述语音增强样本进行分帧处理，得到语音帧；

对所述语音帧进行去噪处理，得到语音样本特征；

将所述语音样本特征输入到深度神经网络模型进行训练，所述深度神经网络模型的输出层的每个神经单元得到后验概率；

将所述后验概率组合成后验概率序列，将所述后验概率序列与预设阈值概率序列进行比较，确定输入语音的关键词。

根据本发明实施例的机器人唤醒的语音关键词识别方法，至少具有如下有益效果：通过语音增强可有效缓解因数据不平衡或者太少而造成的训练效果差或者无法训练等问题；同时去噪处理可有效减少环境噪声对关键词识别造成的影响，具有对不同噪声环境的良好鲁棒性，提高了关键词识别的正确率，从而提高了唤醒机器人的工作效率。

根据本发明的一些实施例，所述语音增强，包括：