[发明专利]基于GPU的卷积神经网络批归一化处理方法在审

专利信息
申请号: 202110294597.5 申请日: 2021-03-19
公开(公告)号: CN113011563A 公开(公告)日: 2021-06-22
发明(设计)人: 孙圣力;马建伟 申请(专利权)人: 北京大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08;G06T1/20
代理公司: 无锡永乐唯勤专利代理事务所(普通合伙) 32369 代理人: 孙际德
地址: 100000*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 gpu 卷积 神经网络 归一化 处理 方法
【说明书】:

发明提供了一种基于GPU的卷积神经网络批归一化处理方法,包括:获取训练数据集,训练数据集包括多个与多个训练通道一一对应的训练数据子集;判断训练数据子集的数据规模是否超过预定阈值。在训练数据子集的数据规模未超过预定阈值时,训练数据子集被分配并缓存至GPU的一个计算单元上,计算单元对分配到的训练数据子集进行批归一化;在训练数据子集的数据规模超过预定阈值时,训练数据子集被分配并缓存至所述GPU的至少两个计算单元上,至少两个计算单元对分配到的训练数据子集进行批归一化。本发明中,训练数据被缓存在GPU的计算单元的片上高速存储中,因此BN处理过程中,GPU无需再执行重复的数据读取过程,从而提升了BN的处理效率。

技术领域

本发明涉及大数据领域,具体而言,本申请涉及一种基于GPU的卷积神经网络批归一化处理方法。

背景技术

卷积神经网络模型在训练过程中,如果某些层的输入数据的数值分布不均匀,方差过大,将会导致训练过程中反向传播时低层梯度消失,影响训练速度。因此,在卷积神经网络的训练过程中,一般会将输入数据进行归一化处理,使数据变为均值为0,标准差为1的分布或者范围在0~1的分布。

批归一化(Batch Normalization,简称BN)是由Google于2015年提出的一个深度神经网络的训练技巧,其不仅可以加快模型的收敛速度,而且更重要的是在一定程度缓解了深层网络中“梯度弥散(特征分布较散)”的问题,从而使得训练深层网络模型更加容易和稳定。BN作为卷积神经网络的一层,一般被放在激活函数(如Relu)之前,其通过对输入数据进行处理,将数据处理为均值为0,方差为1的分布。

传统的BN处理,在进行模型训练的过程总共需要重复读取内存以获取输入数据,重复的访存极大地降低了BN的执行效率。

发明内容

为了解决上述技术问题中的至少一个,本发明提供了一种基于GPU的卷积神经网络批归一化处理方法,其具体技术方案如下:

一种基于GPU的卷积神经网络批归一化处理方法,所述卷积神经网络包括多个训练通道,所述GPU包括多个计算单元,所述批归一化处理方法包括:

获取输入的训练数据集,所述训练数据集包括多个与所述多个训练通道一一对应的训练数据子集;

判断所述训练数据子集的数据规模是否超过预定阈值;

在所述训练数据子集的数据规模未超过预定阈值时,所述训练数据子集被分配并缓存至所述GPU的一个计算单元上,所述计算单元对分配到的所述训练数据子集进行批归一化;

在所述训练数据子集的数据规模超过预定阈值时,所述训练数据子集被分配并缓存至所述GPU的至少两个计算单元上,所述至少两个计算单元对分配到的所述训练数据子集进行批归一化。

在一些实施例中,所述预定阈值与所述GPU的一个计算单元的片上高速存储的存储容量相匹配。

在一些实施例中,所述计算单元对分配到的所述训练数据子集进行批归一化包括:

根据公式计算所述训练数据子集的均值,其中,m为所述训练数据子集所包括的训练数据的数量,xi为所述训练数据子集中的第i个训练数据;

根据公式计算所述训练数据子集的方差;

基于计算出的所述训练数据子集的均值和方差,根据公式实施对所述训练数据子集的归一化处理;

根据公式对经过归一化处理后的训练数据子集中的每个训练数据进行偏移操作,其中,γ、β为偏移参数。

在一些实施例中,所述至少两个计算单元对分配到的所述训练数据子集进行批归一化包括:

所述至少两个计算单元中的各所述计算单元分别计算出分配到的训练数据的局部和值及局部平方和值;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110294597.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top