[发明专利]一种caffe框架残差网络配置文件格式转换方法及系统有效
| 申请号: | 201710770739.4 | 申请日: | 2017-08-31 |
| 公开(公告)号: | CN107480115B | 公开(公告)日: | 2021-04-06 |
| 发明(设计)人: | 王丽;王洪伟 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
| 主分类号: | G06F40/157 | 分类号: | G06F40/157;G06N3/04 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
| 地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 caffe 框架 网络 配置 文件格式 转换 方法 系统 | ||
本发明提供一种caffe框架残差网络配置文件格式转换方法及系统,该方法包括:获取caffe框架残差网络配置文件中的参数数据,所述参数数据包括参数名和与所述参数名对应的参数值;建立所述参数名与OpenCL模板中各位置的对应关系;利用所述对应关系,将对应的参数值填到所述模板的对应位置;输出得到目标格式配置文件。本发明中所采用的方法能够获取caffe框架残差网络配置文件中的参数数据,并建立对应关系,将参数数据填充到OpenCL模板中去,从而相对于现有技术中采用人工手动填写参数数据到OpenCL格式文件相比,能够减少对人工的依赖、提高工作效率、减少失误。
技术领域
本发明涉及数据处理技术领域,特别涉及一种caffe(ConvolutionalArchitecture for Fast Feature Embedding,卷积神经网络框架)框架残差网络配置文件格式转换方法及系统。
背景技术
深度学习作为机器学习的一个分支,是人工智能(AI)中发展迅速的领域之一,可帮助计算机理解大量图像、声音和文本形式的数据。近年来随着caffe等深度学习开源工具趋于成熟,深度学习技术发展迅速,目前,深度学习在人脸识别、语音识别、精准医疗以及无人驾驶等领域正被广泛的应用。2015年,ImageNet竞赛上,深度学习残差网络(Resnet)取得突破进展,其推出152层的网络结构,Top-5的错误率降到3.5%附近,引起了深度学习神经领域的强烈反应,基于caffe等深度学习开源框架研究残差网络成为开发人员研究的热点。
Caffe是一个清晰而高效的深度学习框架,基于C++/CUDA架构,支持命令行、Python和MATLAB接口;可以在CPU和GPU直接无缝切换,其内部提供了一套基本的编程框架,用以实现GPU并行架构下的深度卷积神经网络、深度学习等算法。基于caffe框架的残差网络,在prototxt文本文件定义其网络模型Net,主要是定义了所有的layers(网络层)以及与layer相连的数据流,caffe中仅需一条训练或测试命令,即可根据prototxt文件中定义的网络,完成网络模型的训练或测试。不过,因为深度学习处理大量数据需要大量的计算能力,其本身的发展也面临着众多困境,如深度学习软件扩展性不够高、计算性能不够高、深度学习线上识别能耗大等等问题。
与CPU相比,GPU能够提升深度学习所需的计算密集型程序的计算速度,但是,GPU高能耗、小缓存等特点限制了其能效的提升与应用范围。而FPGA(Field-ProgrammableGate Array,即现场可编程门阵列)异构平台因其低功耗、可编程、高度并行等特性,已经成为互联网公司提高数据中心服务器性能及降低功耗的最佳解决方案之一。FPGA异构计算平台采用高层次综合编程模型,基于OpenCL(Open Computing Language,开放运算语言)语言对深度学习神经网络进行研究和优化,完成神经网络算法在FPGA平台上的高效移植和部署,通过充分利用板卡硬件流水设计和任务级并行,能够大幅提升了深度学习神经网络算法的计算性能。
然而,在基于FPGA实现深度学习残差网络异构加速的研发过程中,研发人员需要针对不同的网络模型填写残差网络的配置参数到OpenCL代码所需的头文件;对于更深层次的网络模型,至少需要20名工程师1天的时间去完成,消耗较大的研发力量,并且有很大可能造成失误,影响研发效率。
因此,如何完成文件的格式转换,减少对人工的依赖、提高工作效率、减少失误,是本领域技术人员亟待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种caffe框架残差网络配置文件格式转换方法及系统,能够减少对人工的依赖、提高工作效率、减少失误。其具体方案如下:
一方面,本发明提供一种caffe框架残差网络配置文件格式转换方法,包括:
获取caffe框架残差网络配置文件中的参数数据,所述参数数据包括参数名和与所述参数名对应的参数值;
建立所述参数名与OpenCL模板中各位置的对应关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710770739.4/2.html,转载请声明来源钻瓜专利网。





