[发明专利]神经网络模型的生成方法及装置在审
申请号: | 201910565729.6 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110363286A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 黄盈;周大军;李旭冬 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络模型 数值集合 参数值更新 | ||
本发明公开了一种神经网络模型的生成方法及装置。其中,该方法包括:从超参数值集合中确定第一神经网络模型中的超参数所对应的超参数值;获取对所述第一神经网络模型进行训练得到的第二神经网络模型的第一模型精确度;在所述第一模型精确度低于目标精确度的情况下,将所述第一神经网络模型中的部分超参数的超参数值更新为所述超参数值集合中对应的目标超参数值,得到第三神经网络模型。本发明解决了生成神经网络模型的效率较低的技术问题。
技术领域
本发明涉及计算机领域,具体而言,涉及一种神经网络模型的生成方法及装置。
背景技术
目前搭建神经网络模型的过程中都是由人工调整神经网络架构,这种方法是100%手动,是研究人员和机器学习工程师最广泛采用的方法。工作流程非常简单,比如:设计了一个游戏人工智能(AI)的模仿学习流程,然后按顺序迭代不同的神经网络模型架构,训练出该神经网络架构的模仿学习模型权重,应用该权重到游戏中观察其AI效果,直到模型满足AI的需求。
首先人工设计神经网络架构需要开发人员对深度学习、神经网络架构有较丰富的经验才能够设计出一款适合AI需求的神经网络架构。如果缺乏机器学习的经验,那么很难设计出一个性能出色的机器学习模型。其次,基于人工的方案,在把机器学习用于新应用上时,必须投入人力来完成针对新应用的神经网络架构设计。此外,针对同一款应用要想获得一个效果比较好的AI,需要实验很多神经网络架构,这需要耗费大量的人工开销。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种神经网络模型的生成方法及装置,以至少解决生成神经网络模型的效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种神经网络模型的生成方法,包括:
从超参数值集合中确定第一神经网络模型中的超参数所对应的超参数值,其中,第一神经网络模型是输入层、具有超参数值的结构层、和输出层通过目标连接方式进行连接得到的神经网络模型;
获取对第一神经网络模型进行训练得到的第二神经网络模型的第一模型精确度,其中,第一模型精确度用于指示使用第二神经网络模型对验证样本集合进行检测的精确度;
在第一模型精确度低于目标精确度的情况下,将第一神经网络模型中的部分超参数的超参数值更新为超参数值集合中对应的目标超参数值,得到第三神经网络模型,其中,使用对第三神经网络模型进行训练得到的第四神经网络模型对验证样本集合进行检测的第二模型精确度高于或等于目标精确度。
根据本发明实施例的另一方面,还提供了一种神经网络模型的生成装置,包括:
确定模块,用于从超参数值集合中确定第一神经网络模型中的超参数所对应的超参数值,其中,所述第一神经网络模型是输入层、具有所述超参数值的结构层、和输出层通过所述目标连接方式进行连接得到的神经网络模型;
获取模块,用于获取对所述第一神经网络模型进行训练得到的第二神经网络模型的第一模型精确度,其中,所述第一模型精确度用于指示使用所述第二神经网络模型对验证样本集合进行检测的精确度;
更新模块,用于在所述第一模型精确度低于目标精确度的情况下,将所述第一神经网络模型中的部分超参数的超参数值更新为所述超参数值集合中对应的目标超参数值,得到第三神经网络模型,其中,使用对所述第三神经网络模型进行训练得到的第四神经网络模型对所述验证样本集合进行检测的第二模型精确度高于或等于所述目标精确度。
可选地,所述结构层包括第一残差网络和第二残差网络,其中,所述确定模块包括:
第一确定单元,用于从第一超参数值子集合中确定所述第一残差网络的第一超参数所对应的第一超参数值,其中,所述第一残差网络所具有的多个超参数包括所述第一超参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910565729.6/2.html,转载请声明来源钻瓜专利网。