[发明专利]神经网络的训练方法和通过该训练方法获得的神经网络有效
申请号: | 201611079401.6 | 申请日: | 2016-11-30 |
公开(公告)号: | CN108122033B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 沙浩 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 日本国东京都千*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 方法 通过 获得 | ||
1.一种神经网络的训练方法,其特征在于,所述训练方法包括:
将一组训练样本输入到所述神经网络中,并且对输入的所述训练样本重复进行多次运算处理,每次运算处理包含以下步骤:
对于所述神经网络中的每个激活节点,根据所述每个激活节点的选择概率值,随机地从线性运算和非线性运算之中选择出所述每个激活节点的第一选择结果,并且根据所述每个激活节点的所述第一选择结果,来对所述训练样本进行第一次网络训练,以获得第一训练损失值,其中所述每个激活节点的所述选择概率值包括选择所述线性运算的概率值和选择所述非线性运算的概率值,并且选择所述线性运算的概率值和选择所述非线性运算的概率值之和等于1;
对于所述每个激活节点,根据所述每个激活节点的所述选择概率值,随机地从所述线性运算和所述非线性运算之中选择出所述每个激活节点的第二选择结果,并且根据所述每个激活节点的所述第二选择结果,来对所述训练样本进行第二次网络训练,以获得第二训练损失值;
将所述第一训练损失值与所述第二训练损失值进行比较;
当所述第一训练损失值小于所述第二训练损失值时,将所述第一选择结果与所述第二选择结果不同的激活节点确定为感兴趣节点,并且以相等的增加值,增加每个所述感兴趣节点的所述第一选择结果的概率值,以更新所述每个激活节点的所述选择概率值;以及
当所述第二训练损失值小于等于所述第一训练损失值时,将所述第一选择结果与所述第二选择结果不同的所述激活节点确定为所述感兴趣节点,并且以相等的所述增加值,增加每个所述感兴趣节点的所述第二选择结果的概率值,以更新所述每个激活节点的所述选择概率值;
其中,所述每个激活节点的所述选择概率值的初始值被设定成选择所述线性运算的概率值等于选择所述非线性运算的概率值,并且更新后的所述每个激活节点的所述选择概率值将被用于下一次运算处理。
2.如权利要求1所述的训练方法,其特征在于,所述增加值在0.01~0.0001的范围内。
3.如权利要求1或2所述的训练方法,其特征在于,所述非线性运算采用Sigmoid函数。
4.如权利要求1或2所述的训练方法,其特征在于,所述非线性运算采用tanh函数。
5.一种神经网络,其特征在于,所述神经网络通过采用如权利要求1-4中任一项所述的训练方法来获得,并且在使用所述神经网络时,对于所述神经网络中的所述每个激活节点,采用所述线性运算和所述非线性运算之中概率值高的运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611079401.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多级装配式格构框架建筑结构
- 下一篇:一种光学镜头