[发明专利]一种基于ResNet50网络的AI加速卡仿真测试系统及其工作方法有效
| 申请号: | 202010094700.7 | 申请日: | 2020-02-16 |
| 公开(公告)号: | CN111258839B | 公开(公告)日: | 2022-11-29 |
| 发明(设计)人: | 曹其春;赵雅倩;董刚;梁玲燕;尹文枫 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G06F11/26 | 分类号: | G06F11/26;G06N3/04;G06N3/10 |
| 代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 李修杰 |
| 地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 resnet50 网络 ai 加速卡 仿真 测试 系统 及其 工作 方法 | ||
1.一种基于ResNet50网络的AI加速卡仿真测试系统,其特征在于,所述仿真测试系统包括:
卷积模块,用于根据量化后的数据,按照不同的卷积核进行卷积计算;
激活模块,用于利用ReLU函数进行激活操作;
池化模块,用于根据相应的下采样方法对数据进行降维;
残差模块,用于将branch分支的输入数据和残差数据进行两两加和,获取输出数据,所述branch分支用于组成res;
全连接模块,用于对输入层神经元和输出层神经元建立权重连接;
softmax模块,用于将多个神经元的输出映射到(0,1)区间内,并在(0,1)区间内利用公式进行多分类,其中,其中,o1,o2,o3表示多个神经元;
量化模块,用于对卷积计算后的int32数据进行量化,获取量化后的数据;
其中,所述卷积模块包括:
数据获取单元,用于获取量化后的FeatureMap数据、weights数据、biase数据和量化参数数据;
第一判断单元,用于判断weights数据是否为7*7的卷积核;
拆分单元,用于当weights数据为7*7的卷积核时,将所述7*7的卷积核拆分成3*3的卷积核,并将第一FeatureMap数据拆分成第二FeatureMap数据,所述第一FeatureMap数据为所述7*7的卷积核所匹配的FeatureMap数据,所述第二FeatureMap数据为与3*3的卷积核padding尺寸相匹配的FeatureMap数据;
第二判断单元,用于当weights数据不为7*7的卷积核时,判断weights数据是否为3*3的卷积核;
重排序单元,用于当weights数据为3*3的卷积核时,将所述3*3的卷积核数据重排序为9*9的数据,以及将第二FeatureMap数据的相应区域重排序为9*9的数据;
脉动阵列计算单元,用于将所述9*9的数据进行脉动阵列计算;
第三判断单元,用于当weights数据不为3*3的卷积核时,判断weights数据是否为1*1的卷积核;
所述重排序单元,还用于当weights数据为1*1的卷积核时,将所述1*1的卷积核数据重排序为9*9的数据;
计算单元,用于对重排序后的3*3卷积核数据进行卷积计算,获取输入通道上FeatureMap数据,所述FeatureMap数据的数据格式为int32;
累加单元,用于对输入通道上的FeatureMap数据进行累加,获取输出通道上的FeatureMap数据。
2.根据权利要求1所述的一种基于ResNet50网络的AI加速卡仿真测试系统,其特征在于,所述池化模块具体为最大值下采样池化单元或平均值下采样单元;
所述最大值下采样池化单元,用于选择窗口中最大值作为下采样输出结果;
所述平均值下采样单元,用于统计选择窗口中的数据,计算平均值作为下采样的输出结果。
3.根据权利要求1或2所述的一种基于ResNet50网络的AI加速卡仿真测试系统,其特征在于,所述量化后的数据为:int8数据,float16数据或者int4数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010094700.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑施工用的装配式墙体
- 下一篇:一种矿石粉碎用雷蒙机





