[发明专利]一种音频识别模型的训练和非正常音频识别的方法和装置在审
申请号: | 202011102269.2 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112259078A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 陈华官;张志齐 | 申请(专利权)人: | 上海依图网络科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/02 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 卢志娟 |
地址: | 200051 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 识别 模型 训练 正常 方法 装置 | ||
本申请公开了一种音频识别模型的训练和非正常音频识别的方法和装置,属于人工智能技术领域,该方法包括,分别将每一音频样本划分为多个音频样本片段,并获取各音频样本片段对应的音频类别标签;基于各音频样本的音频特征向量和相应的音频类别标签,以及各音频样本片段对应的音频类别标签,对音频识别模型进行训练,获得符合预设训练条件的音频识别模型。获取识别请求消息中包含的待识别音频;提取待识别音频的音频特征向量;将待识别音频的音频特征向量输入至音频识别模型,获得待识别音频以及待识别音频中的各音频片段对应的目标音频类别。这样,可以获得更细时间粒度的音频识别结果,提高了音频识别的精确度。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种音频识别模型的训练和非正常音频识别的方法和装置。
背景技术
随着多媒体技术的发展,音频的数量和时长呈指数型增长。音频在被上传至网络中时,通常需要对音频进行审核,以避免违反公德以及自发性知觉经络反应(AutonomousSensory Meridian Response,ASMR)等非正常音频在网络中传播。
现有技术下,通常通过用于非正常音频识别的模型,识别音频是否为非正常音频。但是,音频识别结果的时间粒度较粗,语音识别结果的精确度较低。
发明内容
本申请实施例提供一种音频识别模型的训练和非正常音频识别的方法和装置,用以在对音频进行非正常音频识别时,提高音频识别结果的精确度。
一方面,提供一种音频识别模型的训练方法,包括:
获取多个音频样本以及相应的音频类别标签,以及基于卷积神经网络构建的音频识别模型,其中,音频类别标签至少包括:非正常语音和正常语音;
分别将每一音频样本,按照指定音频时长进行划分,获得多个音频样本片段,并分别获取每一音频样本中的每一音频样本片段对应的音频类别标签;
分别提取每一音频样本的音频特征向量;
基于各音频特征向量和相应的音频类别标签,以及各音频样本中的各音频样本片段对应的音频类别标签,对音频识别模型进行训练,获得符合预设训练条件的音频识别模型。
较佳的,基于各音频特征向量和相应的音频类别标签,以及各音频样本中的各音频样本片段对应的音频类别标签,对音频识别模型进行训练,获得符合预设训练条件的音频识别模型,包括:
分别针对每一音频样本,执行以下操作:将音频样本对应的音频特征向量和相应的音频类别标签,以及音频样本中的各音频样本片段对应的音频类别标签,输入至音频识别模型,获得音频样本对应的第一音频类别,以及音频样本中的各音频样本片段对应的第二音频类别;
基于各音频样本对应的音频类别标签和相应的第一音频标签,确定相应的第一损失;
基于各音频样本片段对应的音频类别标签和相应的第二音频标签,确定相应的第二损失;
根据各第一损失和各第二损失,对音频识别模型的参数进行调整,获得调整后的音频识别模型。
较佳的,将音频样本对应的音频特征向量和相应的音频类别标签,以及音频样本中的各音频样本片段对应的音频类别标签,输入至音频识别模型,获得音频样本对应的第一音频类别,包括:
基于卷积神经网络,对音频样本的音频特征向量进行卷积运算处理,获得第一向量;
基于聚合层以及第一分类损失函数,对第一向量进行分类处理,获得音频样本对应的第一音频类别。
较佳的,将音频样本对应的音频特征向量和相应的音频类别标签,以及音频样本中的各音频样本片段对应的音频类别标签,输入至音频识别模型,获得音频样本中的各音频样本片段对应的第二音频类别,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图网络科技有限公司,未经上海依图网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011102269.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种儿童家具板材表面移动磨光机构
- 下一篇:一种建筑水泥加工设备