[发明专利]基于FPGA的深度神经网络的定点化计算方法及装置在审
申请号: | 201810690696.3 | 申请日: | 2018-06-28 |
公开(公告)号: | CN109002881A | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 于福海;张纪伟;景璐 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 滤波器 图像数据 计算方法及装置 定点化处理 移位加法 指数次幂 量化 卷积 神经网络单元 计算效率 逻辑单元 运算过程 并行度 定点数 浮点数 点积 转化 能耗 拓展 | ||
本发明公开了一种基于FPGA的深度神经网络的定点化计算方法及装置,该方法包括:对图像数据进行定点化处理,将图像数据中的浮点数转化为定点数;将神经网络的滤波器中的全部数值均量化为0或2的指数次幂;对定点化处理后的图像数据和量化后的滤波器进行位移加和操作,获取卷积结果;本发明通过将神经网络的滤波器中的全部数值均量化为0或2的指数次幂,可以使深度神经网络卷积过程中的点积操作转化为了较为廉价的移位加法操作,由于FPGA设备上的移位加法操作是基于逻辑单元进行实现的,因此能够从根本上使得神经网络在运算过程中摆脱对于硬件DSP的依赖,拓展了FPGA设备上神经网络单元的并行度、计算效率以及能耗比。
技术领域
本发明涉及计算机信息技术领域,特别涉及一种基于FPGA的深度神经网络的定点化计算方法及装置。
背景技术
随着现代社会科技的发展,尽管当前的FPGA(Field-Programmable Gate Array,现场可编程门阵列)设备已经在一定程度上支持了各种复杂的浮点或定点运算,但是浮点运算效率对于FPGA设备上DSP(Digital Signal Processing,数字信号处理)的数目存在严重的依赖性,而且FPGA设备本身通过硬件电路来实现程序中的计算,其资源一旦消耗不会再进行回收重分配。
现有技术中,当前的FPGA设备的总体计算效率在很大程度上受到FPGA设备上硬件DSP数目的限制,尽管可以通过定点化运算来替代浮点运算能够在一定程度上降低DSP的使用量,但是复杂程序的并行度仍然受限于DSP的数目。因此,如何对FPGA的神经网络卷积过程中的定点化计算进行优化,降低FPGA设备上硬件DSP的使用量以及能耗,是现今亟需解决的问题。
发明内容
本发明的目的是提供一种基于FPGA的深度神经网络的定点化计算方法及装置,以优化FPGA的神经网络卷积过程中的定点化计算,降低FPGA设备上硬件DSP的使用量以及能耗。
为解决上述技术问题,本发明提供一种基于FPGA的深度神经网络的定点化计算方法,包括:
对图像数据进行定点化处理,将所述图像数据中的浮点数转化为定点数;
将神经网络的滤波器中的全部数值均量化为0或2的指数次幂;
对定点化处理后的图像数据和量化后的滤波器进行位移加和操作,获取卷积结果。
可选的,所述对图像数据进行定点化处理,将所述图像数据中的浮点数转化为定点数,包括:
通过快速定点化方法对所述图像数据进行定点化处理,将所述图像数据中的浮点数转化为预设精度的定点数。
可选的,所述将神经网络的滤波器中的全部数值均量化为0或2的指数次幂,包括:
将所述滤波器中的全部数值逐步量化为0或2的指数次幂。
可选的,所述将所述滤波器中的全部数值逐步量化为0或2的指数次幂,包括:
依次将所述滤波器中未量化为0或2的指数次幂的数值中的数值较大的部分的数值量化为0或2的指数次幂。
此外,本发明还提供了一种基于FPGA的深度神经网络的定点化计算装置,包括:
定点化模块,用于对图像数据进行定点化处理,将所述图像数据中的浮点数转化为定点数;
量化模块,用于将神经网络的滤波器中的全部数值均量化为0或2的指数次幂;
卷积模块,用于对定点化处理后的图像数据和量化后的滤波器进行位移加和操作,获取卷积结果。
可选的,所述定点化模块,包括:
定点化子模块,用于通过快速定点化方法对所述图像数据进行定点化处理,将所述图像数据中的浮点数转化为预设精度的定点数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810690696.3/2.html,转载请声明来源钻瓜专利网。