[发明专利]基于自适应L-BFGS算法的深度神经网络的批量学习方法有效

专利信息
申请号: 202111069585.9 申请日: 2021-09-13
公开(公告)号: CN113705724B 公开(公告)日: 2022-08-30
发明(设计)人: 黄鹤;王俊;曹洪龙;胡丹峰;张永亮 申请(专利权)人: 苏州大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 代理人: 李柏柏
地址: 215000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 自适应 bfgs 算法 深度 神经网络 批量 学习方法
【权利要求书】:

1.一种基于自适应L-BFGS算法的深度神经网络的批量学习方法,应用于图像识别系统,其特征在于,包括:

S1.根据手写数字图片数据集构建合适的深度神经网络模型,并将模型中所有可调参数即权值和偏置组成的向量初始化为,设置最大迭代次数为,记忆尺度的个数为;

S2.创建包括若干图片样本的数据集,所述数据集中包括训练集和测试集,从训练集中随机选取小批量图片样本输入到深度神经网络中,根据网络结构逐层计算各神经元的输出,最后得到输出层所有神经元的输出,记为向量;

在步骤S2中,所述深度神经网络模型为5层卷积神经网络CNN模型,其包括:

第一层卷积层,包括6个卷积核,图片样本输入后生成6个24*24的特征图;

第二池化层,采用窗口大小为2*2,并采用平均池化,6个24*24的特征图输入后生成6个12*12的特征图;

第三层卷积层,包括8个卷积核,kernel size=5*5*6,步长为1,无填充,6个12*12的特征图输入后生成8个8*8的特征图;

第四层池化层,采用窗口大小为2*2,采用平均池化,8个8*8的特征图输入后生成8个4*4的特征图;

第五层输出层,手写数字分为0到9这10个类别,第五层输出层神经元个数为10,其与第四层池化层采用全连接方式连接,并且采用Softmax函数使每个神经元输出对应类别的概率,取概率最大的类别作为最终的分类结果,即向量;

S3.根据所选的小批量图片样本的标签和S2中得到的输出计算损失函数值,在第次训练时,通过反向传播公式计算出损失函数的梯度,并计算相应的和;其中,;

S4.根据指数平滑法预测当前迭代的记忆尺度值;其中,表示前一时刻所选K个记忆尺度的平均值,表示前一时刻预测的记忆尺度值,;

S5.根据公式,调整候选区间的上界;其中,,,是预先设定的一个常量,是前一时刻候选区间的上界;

S6.利用多步拟牛顿公式,计算和更新最近组向量对;

S7.令,根据公式计算;其中,,是由向量对计算得到的拟牛顿矩阵;

S8.将得到的从小到大排序,选出前K个值所对应的记忆尺度,并根据这K个记忆尺度计算出K个方向;计算记忆尺度的平均值和平均方向;

S9.将平均方向作为当前迭代时刻的搜索方向,采用强Wolfe线搜计算出步长即学习率后,对网络参数进行更新;若随着迭代次数的增加,损失函数loss的值下降得很慢趋于平稳即网络收敛,并且迭代次数达到设定的最大迭代次数,则训练结束,得到最终训练好的深度神经网络;否则,令,转S2继续训练;

S10、将测试集输入最终训练好的深度神经网络,得到测试集图片识别结果。

2.如权利要求1所述的基于自适应L-BFGS算法的深度神经网络的批量学习方法,其特征在于,所述是深度神经网络训练中的交叉熵函数或者均方误差函数。

3.如权利要求1所述的基于自适应L-BFGS算法的深度神经网络的批量学习方法,其特征在于,在步骤S1中,所述神经网络模型由输入层,隐含层和输出层组成;输入层和输出层神经元个数是固定的;每一层中的神经元接收前一层神经元的输出,并输出到下一层,最终得到神经网络的输出;对于全连接前馈神经网络,假设第层神经元个数为,则第层神经元的净输入为,层神经元的输出为;其中,是第层到第层的权重矩阵,是第层到第层的偏置,表示第层神经元的激活函数。

4.如权利要求1所述的基于自适应L-BFGS算法的深度神经网络的批量学习方法,其特征在于,在步骤S2中,需将获取的数据集划分为训练集和测试集,并归一化使取值范围在0到1之间,归一化公式如下:

其中,表示样本数据中最小值,为最大值;然后将训练集数据随机排序并打包,即分为多批的样本包,每次迭代只选择其中的一个样本包输入到神经网络中,并且每次选择的样本包不一样;接着利用前向传播计算各层神经元的输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111069585.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top