首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]基于学习自动机的深度神经网络增量式训练方法及系统在审

申请号：	201910049826.X	申请日：	2019-01-18
公开（公告）号：	CN109829541A	公开（公告）日：	2019-05-31
发明（设计）人：	李生红;郭浩楠;马颖华;陈秀真	申请（专利权）人：	上海交通大学
主分类号：	G06N3/08	分类号：	G06N3/08;G06N3/06
代理公司：	上海汉声知识产权代理有限公司 31236	代理人：	庄文莉
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	增量式神经网络模型学习自动机训练样本集神经网络训练步骤训练过程原始训练样本分类问题复杂数据现实生活学习策略学习过程原始样本增量样本累积性分解
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于学习自动机的深度神经网络增量式训练方法，其特征在于，包括：

原始样本集训练步骤：采用原始训练样本集对深度神经网络模型进行训练；

增量样本集训练步骤：对前一次训练样本集进行类别扩充，采用扩充后的训练样本集对前一次训练好的深度神经网络模型进行增量式训练。

2.根据权利要求1所述的基于学习自动机的深度神经网络增量式训练方法，其特征在于，所述原始样本集训练步骤包括：

模型构建子步骤：构建深度神经网络模型，赋予深度神经网络的每个连接权重一个包含第一行为和第二行为的学习自动机；

采样子步骤：学习自动机根据选择概率进行采样，选择第一行为或第二行为；

梯度值计算子步骤：从第一训练样本集中抽取样本，计算损失函数对于深度神经网络的网络参数的梯度值，计算梯度值时忽略第二行为的连接；

更新子步骤：根据梯度值对深度神经网络的权重和偏置进行更新；

交互子步骤：每个学习自动机与深度神经网络交互，若学习自动机对应的当前权重大于第一阈值，则对学习自动机进行奖励，否则进行惩罚；

迭代子步骤：从采样子步骤至交互子步骤进行迭代，直至损失函数不能再继续减小，收敛到第一行为的连接为核心连接，收敛到第二行为的连接为边缘连接。

3.根据权利要求2所述的权利要求1所述的基于学习自动机的深度神经网络增量式训练方法，其特征在于，所述增量样本集训练步骤包括：

稀疏度计算子步骤：计算深度神经网络中每一层连接的稀疏度，若稀疏度小于第二阈值，则在对应层添加随机初始化的神经元，使稀疏度达到第二阈值，其中，在分类层中添加与新增类别数量相等的随机初始化的神经元，重置所有边缘连接的学习自动机状态；

迭代训练子步骤：对核心连接采用第一学习速率以及对边缘连接采用第二学习速率进行随机梯度下降的迭代训练，第一学习速率小于第二学习速率。

4.根据权利要求2所述的权利要求1所述的基于学习自动机的深度神经网络增量式训练方法，其特征在于，所述第一行为代表当前连接被激活，所述第二行为代表当前连接被休眠。

5.根据权利要求3所述的权利要求1所述的基于学习自动机的深度神经网络增量式训练方法，其特征在于，所述梯度值计算子步骤中，采用反向传播算法计算损失函数对于深度神经网络的网络参数的梯度值。

6.一种基于学习自动机的深度神经网络增量式训练系统，其特征在于，包括：

原始样本集训练模块：采用原始训练样本集对深度神经网络模型进行训练；

增量样本集训练模块：对前一次训练样本集进行类别扩充，采用扩充后的训练样本集对前一次训练好的深度神经网络模型进行增量式训练。

7.根据权利要求6所述的基于学习自动机的深度神经网络增量式训练系统，其特征在于，所述原始样本集训练模块包括：

模型构建子模块：构建深度神经网络模型，赋予深度神经网络的每个连接权重一个包含第一行为和第二行为的学习自动机；

采样子模块：学习自动机根据选择概率进行采样，选择第一行为或第二行为；

梯度值计算子模块：从第一训练样本集中抽取样本，计算损失函数对于深度神经网络的网络参数的梯度值，计算梯度值时忽略第二行为的连接；

更新子模块：根据梯度值对深度神经网络的权重和偏置进行更新；

交互子模块：每个学习自动机与深度神经网络交互，若学习自动机对应的当前权重大于第一阈值，则对学习自动机进行奖励，否则进行惩罚；

迭代子模块：从采样子模块至交互子模块进行迭代，直至损失函数不能再继续减小，收敛到第一行为的连接为核心连接，收敛到第二行为的连接为边缘连接。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学，未经上海交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910049826.X/1.html，转载请声明来源钻瓜专利网。

上一篇：神经网络运算系统
下一篇：基于多核处理器的多元深度网络模型重构方法及装置

同类专利

专利分类

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top