[发明专利]一种轻量级语音关键词识别方法、设备、介质在审
申请号: | 202211503850.4 | 申请日: | 2022-11-28 |
公开(公告)号: | CN115810357A | 公开(公告)日: | 2023-03-17 |
发明(设计)人: | 汤韬;冯辉;黄奇伟;胡波 | 申请(专利权)人: | 复旦大学;复旦大学义乌研究院 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02;G10L25/03 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 翁惠瑜 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 轻量级 语音 关键词 识别 方法 设备 介质 | ||
1.一种轻量级语音关键词识别方法,其特征在于,包括如下步骤:
获取待识别语音,将所述待识别语音转换为与预设格式匹配的特征帧向量,输入预训练好的关键词识别模型,获取与目标关键词匹配的分类标签的概率数组,根据所述概率数组确定所述待识别语音内是否包含所述目标关键词,
其中,所述关键词识别模型包括:
时间卷积模块,包括多个按照预设的空洞系数组合的卷积层,用于根据所述特征帧向量,提取时序间相关性信息,获取第一输出数据;
嵌套模块,用于根据所述特征帧向量,获取第二输出数据;
压缩模块,包括多个按照预设的步长组合的卷积层,用于对所述第一输出数据以及所述第二输出数据拼接后的数据进行压缩与特征提取,获取第三输出数据;
全连接分类输出模块,用于根据所述第三输出数据,获取所述概率数组。
2.根据权利要求1所述的一种轻量级语音关键词识别方法,其特征在于,所述的时间卷积模块包括按照所述空洞系数进行组合并顺次连接的多组Conv1D和/或Conv2D层以及对应的激活函数层。
3.根据权利要求1所述的一种轻量级语音关键词识别方法,其特征在于,所述的压缩模块包括按照所述步长进行组合并顺次连接多组Conv1D和/或Conv2D层以及对应的激活函数层,用于实现所述第一输出数据和所述第二输出数据在通道维度上拼接并对拼接后的数据进行特征提取和压缩处理。
4.根据权利要求1所述的一种轻量级语音关键词识别方法,其特征在于,所述的全连接分类输出模块包括顺次连接的拉直层以及对应的分类层。
5.根据权利要求1所述的一种轻量级语音关键词识别方法,其特征在于,所述的时间卷积模块包括四组Conv1D层以及对应的ReLU激活函数层,并按照预设的空洞系数进行组合并顺次连接;所述的嵌套模块包括一层Conv1D层以及对应的ReLU激活函数层;所述的压缩模块包括两组Conv2D层以及对应的ReLU激活函数层,并按照预设步长进行组合并顺次连接;所述的全连接分类输出模块包括顺次连接的flatten拉直层与Softmax分类层。
6.根据权利要求5所述的一种轻量级语音关键词识别方法,其特征在于,所述的空洞系数为[1,2,4,8],所述的步长为[2,2]。
7.根据权利要求1所述的一种轻量级语音关键词识别方法,其特征在于,所述的特征帧向量的获取过程包括如下步骤:
采用梅尔滤波器组获取所述待识别语音的梅尔频率倒谱系数,根据所述梅尔频率倒谱系数,获取具有多通道时序数据格式的所述特征帧向量。
8.根据权利要求1所述的一种轻量级语音关键词识别方法,其特征在于,所述的预训练好的关键词识别模型的数据输入过程具体为:
判断所述特征帧向量是否小于或等于预设长度,若是,所述特征帧向量的首帧作为起点帧,且所述特征帧向量不足所述预设长度的部分用0填充,若否,从所述特征帧向量的首帧开始,按照预设的帧步长在时序方向平移,循环确定所述起点帧;
从所述起点帧开始,读取预设长度的特征帧向量作为所述关键词识别模型的输入数据。
9.一种电子设备,其特征在于,包括:一个或多个处理器以及存储器,所述存储器内储存有一个或多个程序,所述一个或多个程序包括用于执行如权利要求1-8任一所述轻量级语音关键词识别方法的指令。
10.一种计算机可读存储介质,其特征在于,包括供电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行如权利要求1-8任一所述轻量级语音关键词识别方法的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学;复旦大学义乌研究院,未经复旦大学;复旦大学义乌研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211503850.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能护带
- 下一篇:一种有源智能超表面辅助的MIMO通信系统控制方法