[发明专利]音频识别方法、系统和机器设备在审
申请号: | 201910087286.4 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109859743A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 苏丹;王珺;陈杰;俞栋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/14;G06K9/62;G06N3/04 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美;叶虹 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明揭示了一种实现音频识别的神经网络训练方法、系统和机器设备。所述方法包括:获取音频数据流;对音频数据流中每个时间帧的不同音频数据,在神经网络中进行网络各层的特征抽取,获得对应时间帧输出的深度特征;为标注数据中的给定标注,通过深度特征对音频数据流在设定损失函数中融合相对给定标注的类间混淆度衡量指数和类内距离惩罚值;通过融合得到的损失函数值,进行神经网络中的参数更新。基于所融合得到的损失函数值进行神经网络的训练,综合音频数据流相对给定标注的类间混淆度衡量指数以及相对中心向量之间距离度量的惩罚来提高所实现音频识别的鲁棒性。 | ||
搜索关键词: | 音频数据流 标注 神经网络 损失函数 音频识别 机器设备 深度特征 时间帧 融合 混淆 神经网络训练 惩罚 数据流 参数更新 距离度量 类内距离 特征抽取 音频数据 中心向量 综合音频 鲁棒性 衡量 输出 网络 | ||
【主权项】:
1.一种实现音频识别的神经网络训练方法,其特征在于,所述方法包括:为音频识别的神经网络训练获取音频数据流,所述音频数据流包括分别对应若干时间帧的音频数据;对所述音频数据流中每个时间帧的不同音频数据,在所训练神经网络中进行网络各层的特征抽取,获得对应时间帧输出的深度特征;为标注数据中的给定标注,通过所述深度特征对所述音频数据流在设定损失函数中融合相对所述给定标注的类间混淆度衡量指数和类内距离惩罚值;通过融合得到相对标注数据中一系列给定标注的损失函数值,进行所述神经网络中的参数更新。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910087286.4/,转载请声明来源钻瓜专利网。