[发明专利]构建神经网络模型的方法、装置、计算机设备和存储介质有效
申请号: | 201911292945.4 | 申请日: | 2019-12-16 |
公开(公告)号: | CN112990461B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 刘伟良 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06N3/10 | 分类号: | G06N3/10;G06N3/0985 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李珂珂 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 神经网络 模型 方法 装置 计算机 设备 存储 介质 | ||
本公开是关于一种构建神经网络模型的方法、装置、计算机设备和存储介质,属于机器学习模块技术领域。所述方法包括:建立神经网络模型对应的当前待确定的网络架构;基于当前待确定的网络架构,生成神经网络模型对应的中间表示信息;基于中间表示信息和预设的代码优化算法,生成优化运行代码;控制执行优化运行代码,获取优化运行代码的整体运行时长,作为当前待确定的网络架构对应的整体运行时长;如果当前待确定的网络架构对应的整体运行时长能够满足预设的网络架构搜索条件,则将当前待确定的网络架构确定为输出结果。采用本公开,可以提高构建网络架构的效率。
技术领域
本公开是关于机器学习模块技术领域,尤其是关于一种构建神经网络模型的方法、装置、计算机设备和存储介质。
背景技术
随着科技的发展,神经网络模型应用到越来越多的技术领域。在实际应用任何一个神经网络模型之前,需要对神经网络模型的网络架构进行设计,在固定了网络架构之后,可以对神经网络模型进行训练。在设计神经网络模型的网络架构的过程中,可以通过人工的方式进行设计,也可以通过神经网络架构搜索的方式进行自动化设计。对于人工的方式,技术人员可以凭借个人的经验设计神经网络模型的网络架构。对于神经网络架构搜索的方式,计算机设备可以尝试建立各种可能的神经网络模型的网络架构,在建立的所有可能的神经网络模型的网络架构中选择性能最优的网络架构进行输出。由不同网络架构构建的神经网络模型在经过一定的训练之后,能够实现相同的功能。但是由于能实现相同功能的神经网络模型的网络架构不同,由不同网络架构构建的神经网络模型分别对应的整体运行时长不一定相同,有的模型整体运行的比较快,有的模型整体运行的就比较慢,整体运行的快慢与它们的网络架构息息相关。因此,即使由不同网络架构构建的神经网络模型在经过训练之后所能达到的功能相同,但是也希望设计出性能比较好的网络架构,如整体运行时长较短的网络架构。
每进行一次神经网络架构搜索处理,计算机设备会建立神经网络模型对应的一个网络架构W,计算机设备会基于神经网络模型运行库中包括的不同类型的网络层分别对应的运行代码,运行由网络架构W构建的神经网络模型。计算机设备还会预估运行上述神经网络模型所需的整体运行时长,如果预估出的整体运行时长能够满足相应的网络架构搜索条件,则停止再次进行神经网络架构搜索处理,并将网络架构W作为输出结果。
相关技术中,神经网络模型运行库的种类不唯一,同一网络架构能够基于不同的神经网络模型运行库来实现。在不同的神经网络模型运行库中可能会对某一X类型的网络层的运行代码进行优化处理,这样优化处理过的X类型的网络层的运行时长会比较短。进而在进行神经网络架构搜索处理的过程中,计算机设备会偏向于选用优化处理过的X类型的网络层构建网络架构,以最终得到最短的整体运行时长。
在实现本公开的过程中,发明人发现至少存在以下问题:
在基于神经网络模型运行库A进行神经网络架构搜索处理得到的网络架构V中,存在较大的概率会包含一个或者多个神经网络模型运行库A中进行过优化处理的X类型的网络层。然而网络架构V能够基于不同的神经网络模型运行库来实现,如果基于未对X类型的网络层进行过优化处理的神经网络模型运行库B去实现网络架构V,那么不一定能够取得和基于神经网络模型运行库A来实现的网络架构一样的效果,因此就需要重新基于神经网络模型运行库B进行神经网络架构搜索处理,以获得基于神经网络模型运行库B实现的整体运行时长较短的网络架构。相关技术中每次更换神经网络模型运行库时,都要重新进行神经网络架构搜索处理,不能直接替换神经网络模型运行库,操作效率较低。
发明内容
为了克服相关技术中存在的问题,本公开提供了以下技术方案:
根据本公开实施例的第一方面,提供一种构建神经网络模型的方法,所述方法包括:
建立神经网络模型对应的当前待确定的网络架构;
基于所述当前待确定的网络架构,生成所述神经网络模型对应的中间表示信息;
基于所述中间表示信息和预设的代码优化工具,生成优化运行代码;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911292945.4/2.html,转载请声明来源钻瓜专利网。