[发明专利]一种并行反卷积计算方法、单引擎计算方法及相关产品有效
| 申请号: | 201880003706.X | 申请日: | 2018-08-28 |
| 公开(公告)号: | CN109844774B | 公开(公告)日: | 2023-01-24 |
| 发明(设计)人: | 曾成龙 | 申请(专利权)人: | 深圳鲲云信息科技有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
| 代理公司: | 深圳智汇远见知识产权代理有限公司 44481 | 代理人: | 郑江燕 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 并行 卷积 计算方法 引擎 相关 产品 | ||
本申请提供一种并行反卷积计算方法、单引擎计算方法及相关产品,所述并行反卷积计算方法包括如下步骤:获取Pd个输入数据,以及Pk个反卷积核参数;将Pd个输入数据同时与一个反卷积核进行运算,形成数据并行;在Pk个反卷积核中同时以Pd个输入数据进行数据并行,形成反卷积并行;其中,Pd和Pk为大于等于1的整数。本申请通过Pd个输入数据与一个反卷积核并行计算,再在Pk个反卷积核中同时以Pd个输入数据进行数据并行形成反卷积并行,极大提高了反卷积神经网络的并行度。
技术领域
本申请涉及计算机以及人工智能技术领域,具体涉及一种并行反卷积计算方法、单引擎计算方法及相关产品。
背景技术
随着生成神经网络在机器学习领域的不断发展与成熟,反卷积层被越来越多的应用到深度卷积网络的算法开发与应用中。卷积操作的作用类似神经网络中的编码器,用于对高维数据进行低维特征提取。反卷积通常用于将低维特征映射成高维输入,相当于一个解码器,实现了低维向量到高维向量的重构。反卷积操作主要应用于对抗生成神经网络,在图像分割、图像生成、边缘检测等领域都有很重要的作用。
现有的反卷积操作计算量大,能耗大,当使在反卷积神经网张加速器上时,使现有反卷积加速器并行度不高,性能不理想,多个反卷积引擎的加入使控制系统复杂。
本申请实施例提供了一种并行反卷积计算方法、单引擎计算方法及相关产品,只采用一个反卷积引擎通过处理器进行反复调用,减少了反卷积引擎的数量,降低功耗。
第一方面,本申请提供一种并行反卷积计算方法,所述方法包括如下步骤:
S1、获取Pd个输入数据,以及Pk个反卷积核参数;
S21、将Pd个输入数据同时与一个反卷积核进行运算,形成数据并行;
S22、在Pk个反卷积核中同时以Pd个输入数据进行数据并行,形成反卷积并行;
其中,Pd和Pk为大于等于1的整数。
第二方面,提供一种并行反卷积单引擎计算方法,其特征在于,所述方法包括如下步骤:
S101、通过总线接口对反卷积计算引擎和存取器进行参数配置;
S102、将输入数据及参数存储到缓存器中;
S103、从缓存器中读取Pk个反卷积核参数k*k,并存储到寄存器中,用于并行计算。
S104、处理器调用反卷积计算引擎,利用反卷积计算引擎,使用第一方面所述的并行反卷积计算方法计算输入数据的第一个输入通道的数据,并将数据结果存储在输出缓存器中;
S105、通过处理器多次调用反卷积计算引擎,迭代多个输入通道,将当前通道输出结果与前一通道输出结果相加,得到当前数据结果,将当前数据结果存储在当前输出缓存器中;
S106、计算完成输入通道后,将输出缓存器中的数据读到存储器中;
S107、重复步骤S103-S106,直到得到最终结果。
优选的,所述步骤S101中包括:
将Pk个反卷积核进行循环展开,形成反卷积处理单元,所述反卷积处理单元用于输入数据的反卷积计算。
优选的,所述步骤S102中包括:
将待处理数据存储在存储器中,通过存取器将待处理数据读到缓存器中作为输入数据备用。
第三方面,一种并行反卷积计算系统,其特征在于,所述系统包括:
获取模块,用于获取Pd个输入数据,以及Pk个反卷积核参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳鲲云信息科技有限公司,未经深圳鲲云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880003706.X/2.html,转载请声明来源钻瓜专利网。





