[发明专利]基于深度学习的关键词识别方法、系统、介质及设备在审
申请号: | 202111389758.5 | 申请日: | 2021-11-23 |
公开(公告)号: | CN113823277A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 李强;朱勇;王尧;叶东翔 | 申请(专利权)人: | 北京百瑞互联技术有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/26;G10L25/24;G10L25/30 |
代理公司: | 北京国科程知识产权代理事务所(普通合伙) 11862 | 代理人: | 曹晓斐 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 关键词 识别 方法 系统 介质 设备 | ||
1.一种基于深度学习的关键词识别方法,其特征在于,包括:
在音频接收端对音频码流解码时,仅进行至标准解码流程中的变换域噪声整形解码步骤,获取所述音频码流对应的离散余弦变换谱系数;
对所述离散余弦变换谱系数进行特征提取,得到梅尔频率倒谱系数;
根据预先训练的深度神经网络模型对所述梅尔频率倒谱系数进行处理,得到所述音频码流对应的关键词概率。
2.根据权利要求1所述的基于深度学习的关键词识别方法,其特征在于,所述仅进行至标准解码流程中的变换域噪声整形解码步骤,获取所述音频码流对应的离散余弦变换谱系数,包括:
根据所述标准解码流程对所述音频码流进行解码,依次进行码流解析、算术与残差解码、噪声填充与噪声增益、时域噪声解码以及所述变换域噪声整形解码后,获得所述离散余弦变换谱系数,其中,该实际解码过程不包括频域与时域的转换过程以及长期后置滤波器的处理过程。
3.根据权利要求1所述的基于深度学习的关键词识别方法,其特征在于,所述对所述离散余弦变换谱系数进行特征提取,得到梅尔频率倒谱系数,包括:
在频域内对所述离散余弦变换谱系数进行预加重处理,并在所述预加重处理后,直接进行能量谱运算处理,省略掉所述预加重处理与所述能量谱运算处理之间的时域到频域的转换过程。
4.根据权利要求3所述的基于深度学习的关键词识别方法,其特征在于,所述预加重处理包括:
在预建立的预加重系数表中提取相应的预加重系数;
根据所述预加重系数对所述离散余弦变换谱系数进行预加重处理,其中所述预加重系数与所述离散余弦变换谱系数一一对应。
5.根据权利要求1所述的基于深度学习的关键词识别方法,其特征在于,所述在音频接收端对音频码流进行解码之前,还包括:
获取多个音频文件分别对应的所述梅尔频率倒谱系数;
根据所述梅尔频率倒谱系数和所述音频文件对应的关键词,对深度网络模型进行训练,获得深度神经网络模型参数,使得当将所述梅尔频率倒谱系数输入到所述深度神经网络模型后,通过深度神经网络模型参数的设定,得到其对应的关键词的准确率大于或等于预设阈值。
6.一种基于深度学习的关键词识别系统,其特征在于,包括:
音频解码模块,其对音频码流进行解码时,仅进行至标准解码流程中的变换域噪声整形解码步骤,获取所述音频码流对应的离散余弦变换谱系数;
特征提取模块,其对所述离散余弦变换谱系数进行特征提取,得到梅尔频率倒谱系数;
神经网络模型处理模块,其根据预先训练的深度神经网络模型对所述梅尔频率倒谱系数进行处理,得到所述音频码流对应的关键词概率。
7.根据权利要求6所述的基于深度学习的关键词识别系统,其特征在于,在所述特征提取模块中,其对频域内的所述离散余弦变换谱系数进行预加重处理,并在所述预加重处理后,直接进行能量谱运算处理,省略掉所述预加重处理与所述能量谱运算处理之间的时域到频域的转换过程。
8.根据权利要求6所述的基于深度学习的关键词识别系统,其特征在于,在所述特征提取模块中的预加重过程包括:
在预建立的预加重系数表中提取相应的预加重系数;
根据所述预加重系数对所述离散余弦变换谱系数进行预加重处理,其中所述预加重系数与所述离散余弦变换谱系数一一对应。
9.一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行权利要求1-5任一项所述的基于深度学习的关键词识别方法。
10.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机指令,其中:所述处理器操作计算机指令以执行权利要求1-5任一项所述的基于深度学习的关键词识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百瑞互联技术有限公司,未经北京百瑞互联技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111389758.5/1.html,转载请声明来源钻瓜专利网。