[发明专利]神经网络的架构优化训练在审
申请号: | 201880053061.0 | 申请日: | 2018-08-10 |
公开(公告)号: | CN111033529A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | K·德诺尔夫;K·A·维瑟斯 | 申请(专利权)人: | 赛灵思公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;李兴斌 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 架构 优化 训练 | ||
1.一种优化具有多个层的神经网络的方法,所述方法包括:
获得实现所述神经网络的推理平台的电路系统的架构约束;
在训练平台上训练所述神经网络,以生成所述多个层的网络参数和特征映射;以及
基于所述架构约束来约束所述网络参数、所述特征映射或所述网络参数和所述特征映射两者。
2.根据权利要求1所述的方法,其中,所述架构约束包括多个约束,并且其中所述约束的步骤使用所述多个约束中的至少一个约束来被执行。
3.根据权利要求2所述的方法,其中,所述约束的步骤使用实现所述神经网络的期望精确度的最大数目的所述多个约束来被执行。
4.根据权利要求1所述的方法,其中,所述约束的步骤在训练所述神经网络的步骤期间被执行。
5.根据权利要求1所述的方法,其中,所述约束的步骤在训练所述神经网络的步骤之后被执行。
6.根据权利要求5所述的方法,还包括:
使用受约束的网络参数、受约束的特征映射或受约束的网络参数和受约束的特征映射两者在所述训练平台上重新训练所述神经网络,以生成新的网络参数。
7.根据权利要求1所述的方法,其中,所述架构约束包括基于所述推理平台的所述电路系统的计算功能的一个或多个约束。
8.根据权利要求7所述的方法,其中,所述计算功能包括所述推理平台的乘法累加电路系统的结构和数据宽度约束。
9.一种计算系统,包括:
硬件平台,用于训练神经网络,所述硬件平台包括至少一个处理器、存储器和训练平台;
软件平台,在所述硬件平台上执行,所述软件平台包括存储在所述存储器中的程序代码,所述程序代码是所述至少一个处理器可执行的,以执行以下功能:
获得实现所述神经网络的推理平台的电路系统的架构约束;
在所述训练平台上训练所述神经网络,以生成所述多个层的网络参数和特征映射;以及
基于所述架构约束来约束所述网络参数、所述特征映射或所述网络参数和所述特征映射两者。
10.根据权利要求9所述的计算系统,其中,所述架构约束包括多个约束,并且其中所述程序代码是可执行的,以使用所述多个约束中的至少一个约束来执行所述约束的功能。
11.根据权利要求9所述的计算系统,其中,所述程序代码是可执行的,以在所述神经网络的训练的功能期间执行所述约束的功能。
12.根据权利要求9所述的计算系统,其中,程序代码是可执行的,以在所述所述神经网络的训练的功能之后执行所述约束的功能。
13.根据权利要求12所述的计算系统,其中,所述程序代码是可执行的,以执行以下功能:
使用受约束的网络参数、受约束的特征映射或受约束的网络参数和受约束的特征映射两者在所述训练平台上重新训练所述神经网络,以生成新的网络参数。
14.根据权利要求9所述的计算系统,其中,所述架构约束包括基于所述推理平台的所述电路系统的计算功能的一个或多个约束。
15.根据权利要求14所述的计算系统,其中,所述计算功能包括所述推理平台的乘法累加电路系统的结构和数据宽度约束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛灵思公司,未经赛灵思公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880053061.0/1.html,转载请声明来源钻瓜专利网。