[发明专利]用于卷积神经网络的高效可配置卷积计算加速器有效
| 申请号: | 201711414668.0 | 申请日: | 2017-12-20 |
| 公开(公告)号: | CN108108812B | 公开(公告)日: | 2021-12-03 |
| 发明(设计)人: | 王中风;王昊楠;林军 | 申请(专利权)人: | 南京风兴科技有限公司 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063 |
| 代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
| 地址: | 210032 江苏省南京市*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 卷积 神经网络 高效 配置 计算 加速器 | ||
1.用于卷积神经网络的可配置卷积计算加速器,包括:
1个模式选择模块,用于控制模块间的数据流,完成选择3*3、5*5、7*7和11*11四种卷积计算模式中的一种;
2个快速卷积模块,用于实现6并行卷积计算,快速卷积模块可以使用任意的6并行快速有限冲击响应结构;
2个补充乘法模块,用于支持快速卷积模块实现7*7卷积计算模式,每个补充乘法模块包含6个乘法器;
1个数据输入模块,用于以正确顺序输入不同卷积计算模式下的数据;
1个数据输出模块,用于以正确顺序输出不同卷积计算模式下的数据,可以使用只含有加法器的电路,或者使用含有压缩器和加法器的电路;
所述用于卷积神经网络的可配置卷积计算加速器还用于实现3*3、5*5、7*7和11*11卷积计算模式,以及,还用于实现12*12及以内其他尺寸卷积计算,具体包括:
在3*3模式下,通过使用快速卷积模块,即使用6并行快速有限冲击响应结构中的3并行快速有限冲击响应滤波器,实现3*3卷积计算模式的方法;
在5*5模式下,通过使用快速卷积模块,即使用6并行快速有限冲击响应结构,并将第6位卷积系数置0,实现5*5卷积计算模式的方法;
在7*7模式下,通过使用补充乘法模块计算第1位卷积结果,结合快速卷积模块的结果,相加得到7*7卷积计算结果的方法;
在11*11模式下,通过使用2个快速卷积模块,同时将第12个卷积系数设为0,并将2个快速卷积模块的结果相加,得到11*11卷积计算结果的方法;
在上述不同模式下,通过适当设置卷积系数来完成12*12及以下尺寸卷积计算的方法。
2.根据权利要求1所述的用于卷积神经网络的可配置卷积计算加速器,还包括优化6并行快速有限冲击响应结构的方法,所述优化6并行快速有限冲击响应结构的方法为使用4-2压缩器,替换6并行快速有限冲击响应结构中部分加法器,得到优化的6并行快速有限冲击响应结构。
3.根据权利要求2所述的用于卷积神经网络的可配置卷积计算加速器,其特征在于,所述6并行快速有限冲击响应结构中,包括优化的3并行快速有限冲击响应滤波器,优化3并行快速有限冲击响应滤波器结构的方法为使用3-2压缩器,替换3并行快速有限冲击响应滤波器中部分加法器,得到优化的3并行快速有限冲击响应滤波器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京风兴科技有限公司,未经南京风兴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711414668.0/1.html,转载请声明来源钻瓜专利网。





