[发明专利]一种基于贝叶斯优化的深度学习超参数的调优改进方法在审
| 申请号: | 201810318790.6 | 申请日: | 2018-04-11 |
| 公开(公告)号: | CN108573281A | 公开(公告)日: | 2018-09-25 |
| 发明(设计)人: | 曹连雨 | 申请(专利权)人: | 中科弘云科技(北京)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100095 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 贝叶斯 并行计算 优化 初始点 迭代过程 计算过程 目标函数 实验设计 算法生成 性能波动 优化算法 有效解决 整体步骤 拉丁方 评估点 数据集 响应 构建 耗时 改进 学习 计算机 | ||
1.一种基于贝叶斯优化的深度学习超参数的调优改进方法,其特征在于:所述方法的整体步骤为:
步骤1、采用快速最优拉丁方实验设计算法生成初始点集X=x1...xt;
步骤2、采用并行计算在计算机中获取上述初始点集的响应Y=y1…yt,同时计算多个点x1...xt在目标函数上的响应y1…yt,构建数据集D={(x1,y1)...(xt,yt)};
步骤3、进入贝叶斯优化迭代过程:
a、用数据集D中所有数据,构建高斯过程模型;
b、使用获取函数u(x)获取下一个评估点xi,i的取值为1~t,xi=argmax u(x|D),计算响应yi=f(xi);
c、增加新数据点到集合D,D←D∪{xi,yi},i←i+1。
2.根据权利要求1所述的基于贝叶斯优化的深度学习超参数的调优改进方法,其特征在于:所述步骤1中快速最优拉丁方实验设计算法具体步骤:
a、给定np、nv、ns,并设定采样区间;其中,np为人为设定的拉丁超立方实验设计生成的初始点数目,nv为变量的维度数目,ns是快速最优拉丁方实验设计算法提出的参数,通常设定为1;
b、计算理论区间分割数nd,其中,当nd为非整数时向上取整得到实际区间分割数
c、计算中间量nb,
d、计算实际生成初始点数目当时,实际生成的初始点数目大于设定的初始点数目np;
e、使用平移传播算法填充拉丁超立方实验设计空间。
3.根据权利要求2所述的基于贝叶斯优化的深度学习超参数的调优改进方法,其特征在于:使用平移传播算法填充拉丁超立方实验设计空间的具体方法为:
①取ns=1,将设计空间原点设定为第一个初始点,即各维变量的最小值;
②将初始点向nv-1个维度分别平移各维度尺度大小的并在余下的一个维度平移该维度尺度大小的得到第二个初始点;
③按步骤②对上一次平移得到的初始点进行平移,得到下一个点,重复本步骤,直到设计空间该方向上设计点数为
④将步骤③得到的第一组数据进行平移,平移方式为:在步骤②中的nv-1个维度分别平移各维度尺度大小的并在余下的一个维度平移该维度尺度大小的得到第二组初始点;
⑤按步骤④中方式,对得到的上一组初始点进行平移,重复本步骤,直到填充满nv-1维的设计空间为止;
⑥当实际生成的初始点数目大于设定的初始点数目np时,跳转到步骤⑦,否则返回使用快速最优拉丁超立方实验设计算法生成的初始点集X;
⑦根据距离公式dij=|xi-xj|,求各初始点xi到设计空间中心xj的距离;舍弃与中心点距离最远的个点,舍弃点的时候需要遵循每个水平上只能舍弃一个点的规则,返回剩余点集X。
4.根据权利要求1所述的基于贝叶斯优化的深度学习超参数的调优改进方法,其特征在于:所述步骤3a中,高斯过程模型使用的高斯核函数公式如下:
其中,θ0为协方差幅度,θd为为尺度因子,r2(x,x′)表示欧拉距离的平方,xd表示点x的第d维分量;x′d表示表示点x′的第d维分量。
5.根据权利要求1所述的基于贝叶斯优化的深度学习超参数的调优改进方法,其特征在于:所述步骤3b中,获取函数为熵搜索函数,即:
其中,均值函数μt(x)=kt(x)T(Kt+σ2I)-1yt;
协方差函数kt(x,x′)=k(x,x′)-kt(x)T(Kt+σ2I)-1kt(x′);
核矩阵为方差σ2=k(x,x′);是概率密度函数,Ψ(x)是累计密度函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科弘云科技(北京)有限公司,未经中科弘云科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810318790.6/1.html,转载请声明来源钻瓜专利网。





