[发明专利]一种卷积神经网络FPGA加速中图像前处理方法及装置在审
| 申请号: | 201910077362.3 | 申请日: | 2019-01-28 |
| 公开(公告)号: | CN109447893A | 公开(公告)日: | 2019-03-08 |
| 发明(设计)人: | 陈海波 | 申请(专利权)人: | 深兰人工智能芯片研究院(江苏)有限公司 |
| 主分类号: | G06T1/20 | 分类号: | G06T1/20;G06N3/04 |
| 代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 刘松 |
| 地址: | 213000 江苏省常州市武进*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像矩阵 滤波器 读取 缓存 卷积神经网络 卷积运算 前处理 图像 摄像头图像 运算结果 输出 | ||
1.一种卷积神经网络FPGA加速中图像前处理方法,其特征在于,包括:
S1,将摄像头图像划分为N×M×3图像矩阵,其中N≥4,M≥4;
S2,令n=1,m=1;
S3,按照第一预设频率依次将所述N×M×3图像矩阵按照n×m×3图像矩阵,n+1×m+1×3图像矩阵以及n+2×m+2×3图像矩阵的顺序存入FPGA的缓存中,其中,1≤n≤N-3,1≤m≤M-3;
S4,按照第二预设频率读取所述n×m×3图像矩阵,所述n+1×m+1×3图像矩阵,所述n+2×m+2×3图像矩阵,并与3×3×3滤波器一起送入PE做卷积运算;
S5,按照第一预设频率将n+3×m+3×3图像矩阵存入FPGA的缓存中;
S6,按照第二预设频率读取所述n+1×m+1×3图像矩阵,所述n+2×m+2×3图像矩阵,所述n+3×m+3×3图像矩阵,并与3×3×3滤波器一起送入PE做卷积运算;
S7,判断是否所述n+3等于N且所述m+3等于M,如果否,则执行步骤S8,如果是,则执行步骤S9;
S8,令n=n+4,m=m+4,返回执行步骤S3;
S9,完成所述摄像头图像与所述3×3×3滤波器的卷积运算,并输出运算结果。
2.根据权利要求1所述的方法,其特征在于,所述第一预设频率为25MHz,所述第二预设频率为225MHz。
3.根据权利要求1所述的方法,其特征在于,所述摄像头图像的格式为RGB888格式。
4.一种卷积神经网络FPGA加速中图像前处理装置,其特征在于,包括:
划分模块,用于将摄像头图像划分为N×M×3图像矩阵,其中N≥4,M≥4;
赋值模块,用于令n=1,m=1;
缓存模块,用于按照第一预设频率将所述N×M×3图像矩阵按照n×m×3图像矩阵,n+1×m+1×3图像矩阵以及n+2×m+2×3图像矩阵的顺序存入FPGA的缓存中,其中,1≤n≤N-3,1≤m≤M-3;
卷积计算模块,用于按照第二预设频率读取所述n×m×3图像矩阵,所述n+1×m+1×3图像矩阵,所述n+2×m+2×3图像矩阵,并与3×3×3滤波器一起送入PE做卷积运算;
所述缓存模块,还用于按照第一预设频率将n+3×m+3×3图像矩阵存入FPGA的缓存中;
所述卷积计算模块,还用于按照第二预设频率读取所述n+1×m+1×3图像矩阵,所述n+2×m+2×3图像矩阵,所述n+3×m+3×3图像矩阵,并与3×3×3滤波器一起送入PE做卷积运算;
判断模块,用于判断是否所述n+3等于N且所述m+3等于M,如果否,则通知赋值模块执行令n=n+4,m=m+4的操作,如果是,则通知输出模块执行操作;
所述赋值模块,还用于令n=n+4,m=m+4,通知所述缓存模块执行操作;
输出模块,用于完成所述摄像头图像与所述3×3×3滤波器的卷积运算,并输出运算结果。
5.根据权利要求4所述的装置,其特征在于,所述第一预设频率为25MHz,所述第二预设频率为225MHz。
6.根据权利要求4所述的装置,其特征在于,所述摄像头图像的格式为RGB888格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深兰人工智能芯片研究院(江苏)有限公司,未经深兰人工智能芯片研究院(江苏)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910077362.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体装置
- 下一篇:一种基于数据分析的图像处理方法及其系统





