[发明专利]构建网络结构的方法与装置、及图像生成方法与装置在审
申请号: | 202010109969.8 | 申请日: | 2020-02-23 |
公开(公告)号: | CN111340190A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 周鹏;张晓鹏;谢凌曦;倪冰冰;田奇 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 陈洪艳;王君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 网络 结构 方法 装置 图像 生成 | ||
1.一种构建网络结构的方法,其特征在于,包括:
获取任务的类别;
基于所述类别,使用网络结构构建模型生成与所述类别对应的目标网络结构,其中,所述网络结构构建模型能够生成多个网络结构,所述多个网络结构用于实现多个不同类别的任务;
根据所述目标网络结构执行所述任务,得到执行结果;
基于所述执行结果,调整所述网络结构构建模型的参数,以使得所述网络结构构建模型生成的网络结构执行任务得到的执行结果更准确。
2.根据权利要求1所述的方法,其特征在于,所述网络结构构建模型包括控制器、类别向量和操作向量,所述控制器用于根据所述类别生成网络结构参数,所述网络结构参数用于指示所述目标网络结构中每一层执行的操作,所述类别向量用于描述所述多个不同类别,所述操作向量用于描述所述多个网络结构的全部候选操作;
其中,所述基于所述执行结果,调整所述网络结构构建模型的参数,包括:
使用强化学习方法,基于奖励更新所述控制器、所述类别向量和所述操作向量,所述奖励是根据所述处理结果确定的。
3.根据权利要求2所述的方法,其特征在于,所述控制器由长短期记忆网络LSTM构成。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述目标网络结构执行所述任务,得到执行结果,包括:
使用目标神经网络执行所述任务,得到所述执行结果,所述目标神经网络包括所述目标网络结构。
5.根据权利要求2或3所述的方法,其特征在于,所述网络结构构建模型还包括生成器,所述生成器包括多个操作层,所述多个操作层中的每一个操作层包括多个候选操作;
其中,在所述根据所述目标网络结构执行所述任务之前,所述方法还包括:
使用所述生成器根据所述网络结构参数在所述每一个操作层包括的多个候选操作中选择目标操作,以生成包括多个操作层的所述目标网络结构。
6.根据权利要求5所述的方法,其特征在于,在所述多个操作层中的至少一个操作层中,至少存在两个候选操作包含相同的参数。
7.根据权利要求5或6所述的方法,其特征在于,在获取b个任务的类别的情况下,所述根据所述目标网络结构执行所述任务,得到执行结果,包括:
通过以下多个步骤执行所述b个任务:
(1)将b个维度为din的输入特征中每一个输入特征,分别执行所述生成器中第1个操作层包括的N个候选操作,得到b个维度为Nxdout的向量,将所述b个维度为Nxdout的向量连接后得到1个维度为bxNxdout的中间特征;
(2)根据所述第1个操作层包括的N个候选操作,将所述b个任务对应的b个网络参数转换为的一位有效编码矩阵,所述一位有效编码矩阵的维度为bxNx1;
(3)对维度为bxNxdout的所述中间特征与维度为bxNxdout的所述一位有效编码矩阵进行广播乘法,得到维度为bxNxdout的矩阵;
(4)将所述bxNxdout的矩阵中维度N对应的每一行中的多个元素相加,得到所述第1个操作层的输出特征,所述第1个操作层的输出特征的维度为bxdout;
(5)对于所述第1个操作层的输出特征,根据所述生成器中第2个操作层包括的N个候选操作,继续执行上面的步骤(1)至(4),直至生成所述生成器中第P个操作层的输出特征,所述第P个操作层的输出特征为所述执行结果;
其中,b、N和P均为正整数,P为所述生成器中操作层的个数。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述任务包括:图像处理,语音处理和/或文本处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010109969.8/1.html,转载请声明来源钻瓜专利网。