[发明专利]一种CNN全连接层运算的多并行加速方法有效
| 申请号: | 201910818287.1 | 申请日: | 2019-08-30 |
| 公开(公告)号: | CN110543936B | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 李宗凌;汪路元;禹霁阳;程博文;李珂;蒋帅;庞亚龙;郝梁;牛跃华;刘伟伟 | 申请(专利权)人: | 北京空间飞行器总体设计部 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04 |
| 代理公司: | 北京理工大学专利中心 11120 | 代理人: | 李微微 |
| 地址: | 100094 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种CNN全连接层运算的多并行加速方法,利用卷积神经网络运算结果的稀疏性特点,通过提前判读卷积神经网络卷积层处理结果的数值,大大减少了对全连接层参数的读操作,有效节省能耗,提升系统能效比;利用FPGA等可编程逻辑器件硬件资源复用、扩展能力强等特点,通过构建并行流水乘累加架构,有效节省处理时间,提升处理效率;通过全面分析目标类型数据、目标特征差异以及应用过程中的错误容忍度等因素,合理设定处理数据格式,在保证处理精度的同时,有效提升数据及参数的存取效率,实现全连接层多并行加速的目的。 | ||
| 搜索关键词: | 一种 cnn 连接 运算 并行 加速 方法 | ||
【主权项】:
1.一种CNN全连接层运算的多并行加速方法,其特征在于,包括如下步骤:/n步骤1、根据目标类型种类及特征选取运算数据格式:/n步骤2、根据全连接层参数数据数量和数据格式位宽确定所需的存储资源,由存储资源和计算硬件资源确定运算并行度k;/n步骤3、将全连接层权重参数数据格式转换为步骤1确定的数据格式;/n假设格式转换后的权重参数数据长度为N,卷积层的数据长度为L;/n从权重参数数据的第一个数据点开始,共抽取长度为L的数据点,得到第一份数据;开始,再抽取长度为L的数据点,得到第二份数据;/n以此类推,直到得到第k份数据;/n再将每份数据的同一位置的数据顺序取出拼接成一组数据,最后得到ceil(N/L/k)组数据,并将其存储至存储器中;其中,ceil函数表示向上取整;/n步骤4、将运算数据输入到CNN全连接层进行运算,其中,每次得到的卷积层运算结果与存储的一组权重参数数据进行乘累加计算,乘累加一次则计数一次;其中,在乘累加计算之前,先对卷积层运算结果进行判定:如果卷积层运算结果为0,不读取该卷积结果对应的权重参数数据,即不进行乘累加计算,但乘法计算计数累计一次;如果卷积层运算结果不为0,读取计数值指向的权重参数数据的列数,卷积层运算结果与该组权重参数数据同时进行乘累加计算并进行累积一次计数,得到当前的k个乘累加计算结果,当乘累加计算计数次数达到L时,则表示此组k个全连接层计算完成,开始下一组全连接层计算,直到完成所有ceil(N/L/k)组数据的乘累加计算;完成全连接层运算后,将运算结果按制定好的数据帧格式连续输出。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京空间飞行器总体设计部,未经北京空间飞行器总体设计部许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910818287.1/,转载请声明来源钻瓜专利网。





