[发明专利]基于间距损失函数的神经网络训练方法和装置在审
申请号: | 201910521431.5 | 申请日: | 2019-06-17 |
公开(公告)号: | CN110222841A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 俞凯;钱彦旻;项煦;王帅;黄厚军 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 间距损失 神经网络训练 神经网络 真实分布 方法和装置 归一化处理 概率分布 预设 预处理 方法更新 函数计算 类别概率 识别性能 随机梯度 损失函数 逐渐减小 标准时 说话 区分性 小批量 输出 申请 | ||
1.一种基于间距损失函数的神经网络训练方法,包括:
对待训练音频进行预处理并输入至神经网络中,所述待训练音频具有预设的说话人类别的真实分布;
输出所述待训练音频的说话人类别概率分布;
使用归一化处理后的Softmax间距损失函数计算所述说话人类别的概率分布与真实分布的差距;
使用小批量随机梯度下降方法更新所述神经网络的参数以逐渐减小所有待训练音频的概率分布与真实分布的差距;
当达到预设标准时,训练完成并固定所述神经网络的参数。
2.根据权利要求1所述的方法,其中,所述归一化处理后的Softmax间距损失函数为A-Softmax损失函数,计算公式如下:
其中,和m≥1是控制角度间隔大小的整数,N是批量大小,c是类的数量,表示样本到投影层的第i个输入,yi是相应的类别标签索引,其中,
3.根据权利要求1所述的方法,其中,所述归一化处理后的Softmax间距损失函数为AM-Softmax损失函数,计算公式如下:
其中和s是一个比例因子,用于确保在训练期间梯度不会太小,
4.根据权利要求1所述的方法,其中,所述归一化处理后的Softmax间距损失函数为AAM-Softmax损失函数,计算公式如下:
其中,
5.根据权利要求1-4中任一项所述的方法,其中,所述对待训练音频进行预处理包括:
为所述待训练音频增加不同类型的噪声以增加待训练音频的数量。
6.根据权利要求5所述的方法,其中,所述对待训练音频进行预处理还包括:
采用基于能量的语音活动检测器对待训练音频进行处理以滤除非语音帧。
7.根据权利要求1所述的方法,其中,所述预设标准为分类的准确率不再上升。
8.一种基于间距损失函数的神经网络训练装置,包括:
输入模块,配置为对待训练音频进行预处理并输入至神经网络中,所述待训练音频具有预设的说话人类别的真实分布;
输出模块,配置为输出所述待训练音频的说话人类别概率分布;
归一化处理模块,配置为使用归一化处理后的Softmax间距损失函数计算所述说话人类别的概率分布与真实分布的差距;
参数更新模块,配置为使用小批量随机梯度下降方法更新所述神经网络的参数以逐渐减小所有待训练音频的概率分布与真实分布的差距;
达标固定模块,配置为当达到预设标准时,训练完成并固定所述神经网络的参数。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910521431.5/1.html,转载请声明来源钻瓜专利网。