[发明专利]一种音频信号处理的方法及装置有效
申请号: | 201911103069.6 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110827798B | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 盘子圣;丁宁 | 申请(专利权)人: | 广州欢聊网络科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L19/02;G10L25/03;G10L25/30;G10L25/45;G10L25/51;G06N3/04;G06N3/08 |
代理公司: | 广州佳睿知识产权代理事务所(普通合伙) 44610 | 代理人: | 李健富;朱彩银 |
地址: | 510000 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 信号 处理 方法 装置 | ||
1.一种音频信号处理的方法,其特征在于,所述方法包括:
对待测音频进行预处理,获得多维梅尔频谱特征序列;
将所述多维梅尔频谱特征序列切片后输入已训练的音频识别模型,并获得所述音频识别模型输出的各音频片段对应的预测概率,所述预测概率为预测该音频片段存在指定类型的音频的概率,所述音频片段具有指定时长,所述指定类型的音频包括无具体语义的音频信号;
根据获得的多个预测概率,生成二分类序列,其中,所述二分类序列中各序列元素与指定时长的音频片段对应;
判断所述二分类序列是否存在符合预设修正规则的序列元素;若是,则对所述序列元素进行修正;
根据所述指定时长,从修正后的所述二分类序列中确定所述指定类型的音频处于所述待测音频中的时间信息;
其中,所述判断所述二分类序列是否存在符合预设修正规则的序列元素,包括:
遍历所述二分类序列,若当前遍历到的序列元素的二分类值为第一预设值,则从当前元素的开始,读取连续N1个元素的二分类值,其中N1为正整数;
若N1个所述二分类值中存在M1个二分类值为第一预设值的元素,且所述M1个二分类值为第一预设值的元素不连续,或者,N1个所述二分类值中存在1个二分类值为第一预设值的元素,则读取所述连续N1个元素前后各N2个元素的二分类值,其中,1M1N1;
若读取的N1+2N2的元素的二分类值中,二分类值为第一预设值的元素的数量小于M2,则将判定当前元素符合预设修正规则,其中,M1M2;
所述对所述序列元素进行修正,包括:
将当前元素的二分类值设置为第二预设值。
2.根据权利要求1所述的方法,其特征在于,所述对待测音频进行预处理,获得多维梅尔频谱特征序列,包括:
对所述待测音频按照指定分帧规则进行分帧,得到对应的音频帧序列;
对所述音频帧序列的各帧进行短时傅里叶变换,生成所述音频帧序列对应的幅度谱;
将所述幅度谱通过预设的梅尔滤波器组进行滤波,得到多维梅尔频谱特征序列。
3.根据权利要求1所述的方法,其特征在于,所述将所述多维梅尔频谱特征序列切片后输入已训练的音频识别模型,包括:
将所述多维梅尔频谱特征序列切片成长度为指定时长的音频片段,其中,各音频片段分别与相邻的前后音频片段之间部分重叠,且分别重叠的时长为所述指定时长的一半;
分别将所述音频片段输入所述音频识别模型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述指定时长,从修正后的所述二分类序列中确定所述指定类型的音频处于所述待测音频中的时间信息,包括:
从所述二分类序列中确定二分类值为第一预设值的元素所处的位置,作为所述指定类型的音频处于所述待测音频中的目标位置;
根据所述指定时长以及所述目标位置,计算所述目标位置对应的时间信息。
5.根据权利要求1或3或4所述的方法,其特征在于,所述音频识别模型采用如下方式训练得到:
获取音频训练数据,所述音频训练数据包括包含指定类型的音频的第一音频训练数据,以及不包含指定类型的音频的第二音频训练数据,所述第一音频训练数据中的指定类型的音频对应的时间信息被预先标记;
按照预先标记的所述时间信息,从所述第一音频训练数据中提取指定类型的音频,并将所述指定类型的音频的分类类型标记为第一类别;
将所述第一音频训练数据中除所述指定类型的音频以外的音频以及所述第二音频训练数据的分类类型标记为第二类别;
对所述音频训练数据进行预处理,获得训练数据多维梅尔频谱特征序列;
对所述训练数据多维梅尔频谱特征序列进行切分,获得多个训练数据音频片段;
采用卷积神经网络CNN以及长短期记忆网络LSTM对所述多个训练音频片段以及对应的分类类型进行建模,生成音频识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州欢聊网络科技有限公司,未经广州欢聊网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911103069.6/1.html,转载请声明来源钻瓜专利网。