[发明专利]用于训练卷积神经网络的方法和装置在审

申请号：	201710859122.X	申请日：	2017-09-21
公开（公告）号：	CN107609645A	公开（公告）日：	2018-01-19
发明（设计）人：	刘文献	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G06N3/08	分类号：	G06N3/08
代理公司：	北京英赛嘉华知识产权代理有限责任公司11204	代理人：	王达佐,马晓亚
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于训练卷积神经网络方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本申请涉及计算机技术领域，具体涉及互联网技术领域，尤其涉及用于训练卷积神经网络的方法和装置。

背景技术

卷积神经网络(Convolutional Neural Network，CNN)是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。

然而，随着卷积神经网络的深度的不断加深，导致用于训练卷积神经网络的各层的输入信息集合的分布不相同，使得训练出的卷积神经网络不稳定。因此，如何提高卷积神经网络的稳定性就成为了当前亟待解决的问题。

发明内容

本申请实施例的目的在于提出一种改进的用于训练卷积神经网络的方法和装置，来解决以上背景技术部分提到的技术问题。

第一方面，本申请实施例提供了一种用于训练卷积神经网络的方法，该方法包括：对于初始化卷积神经网络的各层中的每层，利用至少一块显卡存储该层的输入信息集合，其中，至少一块显卡中的每块显卡存储至少部分该层的输入信息集合；计算至少一块显卡中的每块显卡所存储的至少部分该层的输入信息集合的均值和方差；将至少一块显卡中的每块显卡所存储的至少部分该层的输入信息集合的均值和方差发送至其他显卡，以计算该层的输入信息集合的均值和方差；利用该层的输入信息集合的均值和方差对该层的输入信息集合进行归一化处理，得到该层的归一化的输入信息集合；利用各层的归一化的输入信息集合对初始化卷积神经网络进行训练，得到训练完成的卷积神经网络。

在一些实施例中，利用各层的归一化的输入信息集合对初始化卷积神经网络进行训练，得到训练完成的卷积神经网络，包括：执行以下训练步骤：将每层的归一化的输入信息集合输入至初始化卷积神经网络的每层，得到特征向量集合，确定特征向量集合是否满足预设条件，若满足预设条件，则将初始化卷积神经网络作为训练完成的卷积神经网络；响应于不满足预设条件，调整初始化卷积神经网络的参数，并继续执行训练步骤。

在一些实施例中，输入信息集合包括多个相同类别的输入信息；以及确定特征向量集合是否满足预设条件，包括：计算多个相同类别的输入信息所对应的多个特征向量中的各个特征向量之间的距离，得到第一计算结果；基于第一计算结果，确定是否满足预设条件。

在一些实施例中，计算多个相同类别的输入信息所对应的多个特征向量中的各个特征向量之间的距离，得到第一计算结果，包括：计算多个相同类别的输入信息所对应的多个特征向量中的各个特征向量之间的欧氏距离，得到第一计算结果。

在一些实施例中，基于第一计算结果，确定是否满足预设条件，包括：确定多个相同类别的输入信息所对应的多个特征向量中的各个特征向量之间的欧氏距离是否均小于第一预设距离阈值；若均小于第一预设距离阈值，则满足预设条件；若不是均小于第一预设距离阈值，则不满足预设条件。

在一些实施例中，输入信息集合包括多个不同类别的输入信息；以及确定特征向量集合是否满足预设条件，包括：计算多个不同类别的输入信息所对应的多个特征向量中的各个特征向量之间的距离，得到第二计算结果；基于第二计算结果，确定是否满足预设条件。

在一些实施例中，计算多个不同类别的输入信息所对应的多个特征向量中的各个特征向量之间的距离，得到第二计算结果，包括：计算多个不同类别的输入信息所对应的多个特征向量中的各个特征向量之间的欧氏距离，得到第二计算结果。

在一些实施例中，基于第二计算结果，确定是否满足预设条件，包括：确定多个不同类别的输入信息所对应的多个特征向量中的各个特征向量之间的欧氏距离是否均大于第二预设距离阈值；若均大于第二预设距离阈值，则满足预设条件；若不是均大于第二预设距离阈值，则不满足预设条件。

在一些实施例中，该方法还包括：获取第一输入信息和第二输入信息；将第一输入信息和第二输入信息输入至训练完成的卷积神经网络，得到第一输入信息的特征向量和第二输入信息的特征向量；计算第一输入信息的特征向量和第二输入信息的特征向量之间的距离；基于所计算的距离，确定第一输入信息和第二输入信息是否是同一类别的输入信息，并输出确定结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术（北京）有限公司，未经百度在线网络技术（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710859122.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种双控植入择端输出人工神经元的设计方法
下一篇：一种结合堆叠降噪稀疏自动编码器的遗传算法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于训练卷积神经网络的方法和装置在审

专利文献下载