[发明专利]神经网络超参数提取转换方法、系统、装置及存储介质有效
申请号: | 201711207509.3 | 申请日: | 2017-11-27 |
公开(公告)号: | CN107992299B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 李雪雷;丁良奎;王丽 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F8/33 | 分类号: | G06F8/33;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 参数 提取 转换 方法 系统 装置 存储 介质 | ||
本申请公开了一种神经网络超参数提取转换方法、系统、装置及计算机可读存储介质,包括:利用转换脚本提取Caffe框架中神经网络的网络配置文件和超参数存储文件,分别获取网络配置参数、超参数维度和位置信息;利用转换脚本将网络配置参数、超参数维度和位置信息转换为与目标模板相对应的格式,并写入到目标模板中;利用目标模板,生成目标格式文件;本申请利用转换脚本提取网络配置文件和超参数存储文件,获取各项参数,将各项参数写入到目标模板中,利用与目标格式文件的格式相应的目标模板,生成目标格式文件,完成超参数存储文件到FPGA可运行的目标格式文件的转换,自动完成超参数存储文件到FPGA可运行的目标格式文件的转换,提高了效率。
技术领域
本发明涉及深度学习异构加速领域,特别涉及一种神经网络超参数提取转换方法、系统、装置及计算机可读存储介质。
背景技术
Caffe是一个清晰而高效的深度学习框架,基于C++/CUDA架构,支持命令行、Python和MATLAB接口;可以在CPU和GPU直接无缝切换,其内部提供了一套基本的编程框架,用以实现GPU并行架构下的深度卷积神经网络、深度学习等算法。基于Caffe框架下的网络配置文件有着定义其网络模型的作用,主要是定义了所有的卷积层以及与卷积层相连的数据流,即可根据网络配置文件中定义的网络,完成网络模型的训练或测试。基于Caffe框架下超参数都存储于超参数存储文件下,该文件以结构化形式存储训练完毕的网络参数。因为深度学习处理大量数据需要大量的计算能力,其本身的发展也面临着众多困境,如深度学习软件扩展性不够高、计算性能不够高、深度学习线上识别能耗大等等问题。
深度学习的常用加速引擎有GPU及FPGA。GPU有较多的核心计算单元,这让它拥有较强大的并行处理能力,是当前较多深度学习计算平台常用的加速手段。然而其高昂的价格和超大的功耗给大规模部署带来了诸多问题。并且若要充分发挥GPU的性能,需要等待批处理的数据到达一定量级,这增加了数据处理的延时性。FPGA为可编程门阵列,它能够通过编程重构计算单元,相较GPU有低功耗、低延时、高性价比的特点。
现有技术中,基于Caffe框架下制作的神经网络超参数存储文件无法直接移植到FPGA上运行,需要人工进行文件的转换,严重影响效率。
因此,如何研发一种高效的将神经网络超参数存储文件移植到FPGA上运行方法,是当前的技术难点。
发明内容
有鉴于此,本发明的目的在于提供一种神经网络超参数提取转换方法、系统、装置及计算机可读存储介质,能够将神经网络超参数存储文件高效的移植到FPGA上运行。其具体方案如下:
一种神经网络超参数提取转换方法,包括:
利用转换脚本提取Caffe框架中神经网络的网络配置文件和超参数存储文件,分别获取网络配置参数、超参数维度和位置信息;
利用所述转换脚本将所述网络配置参数、所述超参数维度和所述位置信息转换为与目标模板相对应的格式,并写入到所述目标模板中;
利用所述目标模板,生成目标格式文件;
其中,所述目标模板为与所述目标格式文件的格式相应的模板。
可选的,所述利用转换脚本提取Caffe框架中神经网络的网络配置文件获取网络配置参数的过程,包括:
利用所述转换脚本,遍历并提取所述网络配置文件中每个卷积层的配置参数数据,得到所述网络配置参数。
可选的,所述利用转换脚本提取Caffe框架中神经网络的超参数存储文件,获取超参数维度和位置信息的过程,包括:
利用所述转换脚本根据所述网络配置参数,从所述超参数存储文件中获取所述超参数维度和所述位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711207509.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于惯性定位技术的三维超声波无损检测设备
- 下一篇:一种日历实现方法