[发明专利]一种音频识别模型的训练和非正常音频识别的方法和装置在审
申请号: | 202011102269.2 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112259078A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 陈华官;张志齐 | 申请(专利权)人: | 上海依图网络科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/02 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 卢志娟 |
地址: | 200051 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 识别 模型 训练 正常 方法 装置 | ||
1.一种音频模型训练方法,其特征在于,包括:
获取多个音频样本以及相应的音频类别标签,以及基于卷积神经网络构建的音频识别模型,其中,音频类别标签至少包括:非正常语音和正常语音;
分别将每一音频样本,按照指定音频时长进行划分,获得多个音频样本片段,并分别获取每一音频样本中的每一音频样本片段对应的音频类别标签;
分别提取每一音频样本的音频特征向量;
基于各音频特征向量和相应的音频类别标签,以及各音频样本中的各音频样本片段对应的音频类别标签,对所述音频识别模型进行训练,获得符合预设训练条件的音频识别模型。
2.如权利要求1所述的方法,其特征在于,基于各音频特征向量和相应的音频类别标签,以及各音频样本中的各音频样本片段对应的音频类别标签,对所述音频识别模型进行训练,获得符合预设训练条件的音频识别模型,包括:
分别针对每一音频样本,执行以下操作:将音频样本对应的音频特征向量和相应的音频类别标签,以及所述音频样本中的各音频样本片段对应的音频类别标签,输入至音频识别模型,获得所述音频样本对应的第一音频类别,以及所述音频样本中的各音频样本片段对应的第二音频类别;
基于各音频样本对应的音频类别标签和相应的第一音频标签,确定相应的第一损失;
基于各音频样本片段对应的音频类别标签和相应的第二音频标签,确定相应的第二损失;
根据各第一损失和各第二损失,对所述音频识别模型的参数进行调整,获得调整后的音频识别模型。
3.如权利要求2所述的方法,其特征在于,将音频样本对应的音频特征向量和相应的音频类别标签,以及所述音频样本中的各音频样本片段对应的音频类别标签,输入至音频识别模型,获得所述音频样本对应的第一音频类别,包括:
基于卷积神经网络,对所述音频样本的音频特征向量进行卷积运算处理,获得第一向量;
基于聚合层以及第一分类损失函数,对所述第一向量进行分类处理,获得所述音频样本对应的第一音频类别。
4.如权利要求2所述的方法,其特征在于,将音频样本对应的音频特征向量和相应的音频类别标签,以及所述音频样本中的各音频样本片段对应的音频类别标签,输入至音频识别模型,获得所述音频样本中的各音频样本片段对应的第二音频类别,包括:
基于卷积神经网络,对音频样本的音频特征向量进行卷积运算处理;
从所述卷积神经网络中的指定层,抽取出矩阵向量;
基于第二分类损失函数以及所述矩阵向量,分别获得每一音频样本片段对应的第二音频类别。
5.如权利要求4所述的方法,其特征在于,基于第二分类损失函数以及所述矩阵向量,分别获得每一音频样本片段对应的第二音频类别,包括:
基于卷积神经网络或循环神经网络,对所述矩阵向量进行上下文处理,分别获得每一音频样本片段对应的第二向量;
基于所述第二分类损失函数,分别对每一个第二向量进行分类处理,获得相应的第二音频类别。
6.一种非正常音频识别的方法,其特征在于,采用如权利要求1-5任一项所述方法中的音频识别模型,包括:
接收针对待识别音频的识别请求消息;
获取所述识别请求消息中包含的待识别音频;
提取所述待识别音频的音频特征向量;
将所述待识别音频的音频特征向量输入至所述音频识别模型,获得所述待识别音频以及所述待识别音频中的各音频片段对应的目标音频类别。
7.如权利要求6所述的方法,其特征在于,将所述待识别音频的音频特征向量输入至所述音频识别模型,获得所述待识别音频以及所述待识别音频中的各音频片段对应的目标音频类别,包括:
基于卷积神经网络,对所述待识别音频的音频特征向量进行卷积运算处理,获得第一向量,以及矩阵向量;
基于聚合层以及第一分类损失函数,对所述待识别音频的第一向量进行分类处理,获得所述待识别音频对应的目标音频类别;
基于所述待识别音频的矩阵向量,以及第二分类损失函数,分别获得所述待识别音频中的每一音频片段对应的目标音频类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图网络科技有限公司,未经上海依图网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011102269.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种儿童家具板材表面移动磨光机构
- 下一篇:一种建筑水泥加工设备