[发明专利]神经网络的训练方法和通过该训练方法获得的神经网络有效

专利信息
申请号: 201611079401.6 申请日: 2016-11-30
公开(公告)号: CN108122033B 公开(公告)日: 2022-09-16
发明(设计)人: 沙浩 申请(专利权)人: 株式会社日立制作所
主分类号: G06N3/08 分类号: G06N3/08
代理公司: 上海华诚知识产权代理有限公司 31300 代理人: 肖华
地址: 日本国东京都千*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经网络 训练 方法 通过 获得
【说明书】:

发明提供了一种神经网络的训练方法和神经网络。该方法包括:对输入的一组训练样本重复进行多次运算处理,每次运算处理包含:对于每个激活节点,根据选择概率值,随机地从线性运算和非线性运算之中选择出第一选择结果,来进行第一次网络训练,以获得第一训练损失值;对于每个激活节点,根据选择概率值,随机地从线性运算和非线性运算之中选择出第二选择结果,来进行第二次网络训练,以获得第二训练损失值;当第一训练损失值小于第二训练损失值时,增加每个感兴趣节点的第一选择结果的概率值;以及当第二训练损失值小于等于第一训练损失值时,增加每个感兴趣节点的第二选择结果的概率值。本发明通过引入随机性,提高了神经网络的精度。

技术领域

本发明涉及深度学习领域,更具体地,涉及一种神经网络的训练方法和通过该训练方法获得的神经网络。

背景技术

深度学习,即深度神经网络,是近年来的研究热点之一。深度神经网络与传统神经网络相比没有大的理论改进,最主要的特点是增加了网络的深度或者说增加了网络的层数,同时更得力于大规模数据与高性能的计算硬件的普及。具有标志性的事件是,深度学习在2013年的ImageNet图片分类比赛中对于非深度学习方法取得压倒性优势,从而获得研究者的广泛关注。近年来深度学习方法在图像、语音、自然语言处理等领域均取得了突破性发展。在图像领域,对于图片分类任务,深度神经网络已经取得接近人眼的分辨力;在语音识别、语音合成等语音信号处理领域,深度神经网络已经完全取代了传统的算法;在自然语言处理,深度神经网络从2015年开始,已经处于研究热点地位。另外,深度神经网络,也越来越多的在通用人工智能领域取得应用,如DeepMind公司设计的AlphaGo已经可以打败人类棋手。

目前工程实践中针对不同应用,深度神经网络大致可以分为三种类型。第一种,卷积神经网络(CNN),卷积神经网络主要用于图像处理领域,可以获得图像中局部像素之间的特定特征。第二种,循环神经网络(RNN),可以获得时序信号上的特定特征,主要用于自然语言处理、语音处理等领域。第三种,策略网络(Policy network),可以根据当前的策略状态来生成当前策略下的最优策略。对于这些各种不同的应用,各种不同的网络,从理论与程序设计上又最终都可以归结为传统的经典单层神经网络。

在工程应用上,经典单层神经网络可以归结为输入值、权值系数、线性激活值和非线性激活值。其中,输入值、线性激活值和非线性激活值均为向量,以及权值系数为矩阵。

在经典单层神经网络的训练阶段,首先,通过权值系数对输入的一组训练样本(即,输入值)进行线性运算,以获得线性激活值;然后,利用非线性函数对获得的线性激活值进行非线性运算,以获得非线性激活值,从而得到训练损失值,即非线性激活值和输入值之间的差值。通过多次重复运算,不断地调整经典单层神经网络的权值系数的值,以使得训练样本的训练损失值变小,从而达到拟合数据的目的。从直观上理解,小的训练损失值往往代表着更佳的网络性能。

图1显示了传统的经典单层神经网络的结构示意图。为了简化,图1仅显示了具有三个激活节点1-3的简单的经典单层神经网络,并且忽略了神经网络的偏置输入。

在图1所示的经典单层神经网络中,向量X1、X2、X3构成输入值表示输入到经典单层神经网络中的一组训练样本;向量Y1、Y2、Y3构成线性激活值其中向量Y1表示激活节点1的线性激活值,向量Y2表示激活节点2的线性激活值,以及向量Y3表示激活节点3的线性激活值;向量O1、O2、O3构成非线性激活值其中向量O1表示激活节点1的非线性激活值,向量O2表示激活节点2的非线性激活值,以及向量O3表示激活节点3的非线性激活值。

假设权值系数W为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611079401.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top